Dialogue and Argumentation for Cultural Literacy Learning in Schools: Multilingual Data Corpus

Rapanta, Chrysi; Cascalheira, Dilar; Gil, Beatriz; Gonçalves, Cláudia; Garcia, D'Jamila; Morais, Rita; Pereira, João Rui; Čermáková, Anna; Maine, Fiona; Peck, Julia; Brummernhenrich, Benjamin; Jucks, Regina; Petronytė, Miglė; Valančienė, Daina; Juskiene, Vaiva; Badaukienė, Ramunė; Eigminienė, Dainora; Stonkuviene, Irena; Zaleskienė, Irena; Garcia-Mila, Mercè; Remesal, Ana; Castells, Nuria; Gilabert, Sandra; Miralda-Banda, Andrea; Luna, Jose; Vrikki, Maria; Evagorou, Maria; Chatzianastasi, Maria; Karousiou, Christiana; Papanastasiou, Elena; Stylianou-Georgiou, Agni; Rodosthenous, Marina; Talli, Cedar; Cohen, Irit; Shalom Greenberg, Chaim; Bar, Noa; Sarfati, Neta; Schwarz, Baruch

doi:10.5281/zenodo.4742176

Published May 7, 2021 | Version 2

Dataset Open

Dialogue and Argumentation for Cultural Literacy Learning in Schools: Multilingual Data Corpus

1. Universidade Nova de Lisboa, Portugal
2. University of Cambridge, UK
3. Westfälische Wilhelms-Universität Münster, Germany
4. Vilniaus Universitetas, Lithuania
5. Universitat de Barcelona, Spain
6. University of Nicosia, Cyprus
7. The Hebrew University of Jerusalem, Israel

This dataset is the Multilingual Corpus of the DIALLS (DIalogue and Argumentation for Literacy Learning in Schools) project (dialls2020.eu/) and consists of a set of transcripts of classroom interactions of students from ages 5 to 15 years old. These classroom interactions took place in seven DIALLS participant countries (UK, Portugal, Germany, Lithuania, Spain, Cyprus, and Israel).

The corpus is a set of 202 transcripts in the participant countries’ native language (English, Portuguese, German, Lithuanian, Catalan, Cypriot Greek, and Hebrew). The transcripts in each native language range from a maximum of 35 for Hebrew (more than 17% of the overall corpus) to a minimum of 19 transcripts for Cypriot Greek (10% of the corpus). More than 50% of the transcripts in a language different from English (90 transcripts) have associated their English translation. The topic of the project is cultural literacy through dialogue and argumentation in school children.

The Multilingual Corpus is relevant to the following areas of research: Educational dialogue, Citizenship education, Argumentation and learning, Multimodal literacy, Dialogic teaching, Dialogue/discourse analysis, Arts-based education, Cultural studies, Teacher professional development and communities.

The dataset is organised in two main sections: an Excel file, and a zip folder with .csv files matching the excel file. A description of the corpus and further information on the dataset can be accessed in a .pdf file.

Files

1.DIALLS_Multilingual_Corpus_description.V2.pdf

Files (12.0 MB)

Name	Size	Download all
1.DIALLS_Multilingual_Corpus_description.V2.pdf md5:5afd69a0de34782cfd3cca14fa4b9422	408.5 kB	Preview Download
2.DIALLS_Multilingual_Corpus.V2.zip md5:7fc349a3716163ca48f2f55c8bec628e	3.8 MB	Preview Download
3.DIALLS_Multilingual_Corpus.V2.xlsx md5:f6e39b043ae2b27341208e19113db724	7.8 MB	Download

Additional details

Cites: Project deliverable: https://dialls2020.eu/wp-content/uploads/2019/06/D3.1-final.pdf (URL); Project deliverable: https://dialls2020.eu/wp-content/uploads/2019/01/D2.3_final-submitted.pdf (URL)

European Commission
DIALLS - DIalogue and Argumentation for cultural Literacy Learning in Schools 770045

	All versions	This version
Views	2,482	1,756
Downloads	1,521	1,260
Data volume	3.8 GB	2.8 GB

1.DIALLS_Multilingual_Corpus_description.V2.pdf

Files (12.0 MB)

Related works

Funding

Dialogue and Argumentation for Cultural Literacy Learning in Schools: Multilingual Data Corpus

Authors/Creators

Description

Files

1.DIALLS_Multilingual_Corpus_description.V2.pdf

Files (12.0 MB)

Additional details

Related works

Funding