Info: Zenodo’s user support line is staffed on regular business days between Dec 23 and Jan 5. Response times may be slightly longer than normal.

Published March 25, 2023 | Version 1.2
Dataset Open

JALCOS: Japanese Learner Corpus of Spanish

  • 1. Aichi University
  • 2. Kansai Gaidai University


Version 1.2, March 2023.

INTRODUCTION: Corpus of Japanese learners of Spanish composed of 222 essays (about 87,000 words) written by 222 students of Spanish as a college major (Japanese as L1, English as L2 and Spanish as L3). The criteria used to build the corpus follow those of the International Corpus of Learner English (ICLE). The corpus was designed by Professor Yoshihito Kamakura (Aichi University), who collected the data in 2004 at five Japanese universities where Spanish as a major is offered (from highest to lowest number of texts): Sophia University, Tokoha University, Nanzan University, Aichi Prefectural University and Osaka University of Foreign Studies.

The participants, from first to fourth grade, wrote a text on a topic to be chosen from seven proposed topics, and filled out a consent form and a questionnaire. Only participants whose native language is Japanese were finally included in the corpus.

METADATA: The header contains the following metadata. An example is enclosed in quotation marks.

_02_a_universidad="Universidad Provincial de Aichi"
_06_a_otras_L="L2: inglés L3: español"
_11_t_tema_asignacion="Opción múltiple"
_12_t_titulo="¿Con qué huirías si ocurriera un gran terremoto?". The participants chose one topic among seven (instructions were shown in Japanese, see below). We have added a short title in Spanish.
_13_t_macrofuncion="Narración: futuro"
_14_t_minimo_palabras="400". The minimum number of words required was 200 words for first-year students, and 400 for the rest.
_15_t_ayuda="Sí". Indicates whether the participant used any writing aids (dictionary, etc.) or not.

The texts contain marks for start and end of paragraph (<p> and </p>).

TOPICS: The topics are inspired by those proposed in other learner corpora such as the ICLE (International Corpus of Learner English) or the JEFLL corpus (Japanese EFL Learner Corpus):

A. 現代社会は科学やテクノロジーに支配されているという意見があります。もはや夢や想像の世界は存在しないのでしょうか?あなたの意見を書いてください。
(Existe la opinión de que la sociedad moderna está dominada por la ciencia y la tecnología, y de que ya no hay lugar para los sueños y la imaginación. ¿Ya no existen los sueños ni los mundos imaginarios? Escriba su opinión.)
Short title: El mundo de los sueños y la imaginación en la sociedad moderna.

B. 大学での勉強は実社会では役にたたないという人がいます。あなたは賛成ですか、それとも反対ですか?
(Hay quien dice que estudiar en la universidad no es útil en el mundo real. ¿Está de acuerdo?)
Short title: ¿Estudiar en la universidad es útil en el mundo real?

C. あなたの経験を交えて、外国語の習得についてのあなたの考えを書いてください。
(Escriba su opinión sobre el aprendizaje de un idioma extranjero, basándose en su propia experiencia.)
Short title: ¿Qué opinas sobre el aprendizaje de lenguas extranjeras?

D. 『お金は諸悪の根源』という言葉があります。あなたは賛成ですか、反対ですか?
(¿Está de acuerdo con el dicho "El dinero es la raíz de todos los males”?)
Short title: ¿El dinero es la raíz de todos los males?

E. もし大地震が起こったら何を持って逃げますか?なぜそれを選ぶのですか?
(Si hubiera un terremoto y tuviera que escapar, ¿qué se llevaría con usted? ¿por qué?)
Short title: ¿Con qué huirías si ocurriera un gran terremoto?

F. あなたがこれまで見た夢の中で最も恐ろしかった夢について書いてください。
(Escriba sobre el sueño más aterrador que haya tenido.)
Short title: Mi peor sueño.

G. あなたは旅行が好きですか?あなたの経験を交え、なぜ好きなのか書いてください。
(¿Le gusta viajar? Comparta su experiencia y escriba por qué le gusta.)
Short title: ¿Te gusta viajar?

CAVEAT: In the course of almost 20 years since the collection of the data, some was lost before being digitized.

Approximately one third of the texts have some incomplete metadata, which is indicated with the label "--Desconocido--". 

LICENSE: The corpus is distributed under a CC BY-NC 4.0 license:

ACKNOWLEDGEMENTS: The development of the corpus was possible thanks to the invaluable collaboration of the teachers who collected data in their classes, and to the students who agreed to participate in the research.

CORPUS QUERYING: This corpus has been included in the CELEN Corpus collection (version 1.2), which can be consulted freely with Sketch Engine at


-Corpus design and data collection: Yoshihito Kamakura, Aichi University.
-Data processing: Pilar Valverde, Kansai Gaidai University.

If you have any questions, please fill out the contact form at:



Files (634.9 kB)

Name Size Download all
629.6 kB Preview Download
5.3 kB Preview Download