Published February 5, 2024 | Version v1
Dataset Open

Inventario morfológico de PRESEEA-Santander (muestra)

  • 1. Fundación Comillas
  • 2. The University of Tokyo

Description

Presentamos a continuación el inventario morfológico lematizado del habla oral contemporánea de la ciudad de Santander (España). Está elaborado a partir de la muestra constituida por 18 informantes de los 54 que integran el corpus completo PRESEEA-Santander. Dicha muestra está preestratificada en torno a las variables de sexo, edad y nivel educativo, conforme a las directrices marcadas en el Proyecto para el Estudio Sociolingüístico del Español de España y América (PRESEEA) (Moreno Fernández 2021).

Un inventario morfológico constituye el lexicón o diccionario mental de los usuarios de la lengua que puede ampliarse según el uso frecuente de las palabras en la lengua que se analice en cada momento. El objetivo de este inventario es reunir la morfología extraída de las entrevistas orales, grabadas y transcritas en el núcleo urbano de una ciudad española, como parte del proyecto mencionado Forma parte, además, del inventario léxico ya presentado por los mismos autores (Martínez y Ueda 2021) y representa, por tanto, una continuidad de este trabajo previo, a partir del cual se pueden generar otras palabras y significados avalados por la comunidad de habla de la lengua, en este caso del español del centro-norte peninsular. Como señala Lieber (2009: 15):

El lexicón de la lengua consiste solamente en morfemas (con las siguientes excepciones: todos los sustantivos irregulares están listados con sus afijos correspondientes para la marca de singular y plural). Las palabras y sus bases léxicas no pueden ser analizadas con certeza y claridad en partículas lingüísticas más segmentadas de las que se presentan (en un inventario morfológico).

El investigador que se acerque a esta obra podrá encontrar, en primer lugar, las palabras base, que se han ordenado alfabéticamente para una mejor localización. Cada una de ellas contiene información sobre la categoría gramatical a la que pertenece, la frecuencia total de aparición en el corpus oral así como las frecuencias correspondientes a las tres variables sociolingüísticas establecidas: sexo, edad y nivel de instrucción. En segundo lugar, aparecen los prefijos y sufijos y los elementos compositivos anterior y posterior, organizados conforme a frecuencias y categorías.
El proceso de lematización se ha llevado a cabo mediante procedimientos automatizados y ha sido supervisado por un experto lingüista nativo, con el fin de depurar incorrecciones.

Files

Inventario morfológico PRESEEA-Santander.pdf

Files (1.9 MB)

Name Size Download all
md5:2f847104f0a63a46be44fffb8f5d0786
1.9 MB Preview Download

Additional details

References