Published December 14, 2025 | Version v1
Dataset Open

Corpus RLD - corpus de uso de recursos lingüísticos en el derecho español

  • 1. Complutense University of Madrid
  • 2. ROR icon Universidad Complutense de Madrid

Description

RLD corpus is a collection of cases where the Spanish High Court and the Constitutional Court Lords or Ladies Justice ("Jueces del Supremo") have turned to Spanish dictionaries and grammar as the linguistic authority to write court judgments. The four main stages followed in the building process of the corpus, (i) design, (ii) implementation, (iii) revision and (iv) publication, are thoroughly explained. The aim of this corpus, which includes 1940 court judgments issued between the years 2012 and 2018, is to provide a representative and empirically adequate sample of data of the use of dictionaries and grammar as linguistic authority in Spanish jurisprudence. This corpus comes to fill a gap in the studies of Language and Law: on the one hand, the lack of large shared corpora of legal texts, available for any researcher or research group interested in this issue, and, on the other hand, the need to analyze empirically the use of dictionaries and grammar in the court judgments of the Spanish High Court and the Constitutional Court.

Abstract (Spanish)

El corpus RLD es una recopilación de sentencias dictadas por jueces de los Tribunales Supremo y Constitucional, quienes han optado por el uso de diccionarios y la gramática del español como autoridad lingüística en la redacción de dichas sentencias judiciales. Las cuatro fases seguidas para la construcción del corpus: (i) diseño, (ii) implementación, (iii) revisión y (iv) publicación se explican detalladamente. El objetivo del corpus, que incluye 1940 sentencias emitidas entre los años 2012 y 2018, es proporcionar una muestra de datos representativos y empíricamente satisfactorios del empleo de los diccionarios y la gramática como autoridad lingüística en la jurisprudencia española. Este corpus viene a cubrir un vacío en los estudios de Lengua y Derecho: por una parte, la ausencia de grandes corpus de textos jurídicos compartidos, disponibles para cualquier investigador o grupo de investigación interesado, y, por otra, la necesidad de analizar empíricamente el uso del diccionario y la gramática en las sentencias de los Tribunales Supremo y Constitucional.

Notes

The documents come from the online legal databases Tirant Online, published by Tirant (https://www.tirantonline.com), and Aranzadi, published by Thomson Reuters (http://aranzadi.aranzadidigital.es).”

Los documentos proceden de las bases de datos jurídicas en línea: Tirant Online, de la editorial Tirant (https://www.tirantonline.com), y Aranzadi, de la editorial Thomson Reuters (http://aranzadi.aranzadidigital.es)

Files

corpus_sentencias_judiciales_lingüística_universidad_complutense_de_madrid.txt

Additional details

Additional titles

Translated title
RLD Corpus - corpus of linguistic resources in Spanish jurisprudence

Related works

Is described by
Journal: 10.1075/RESLA.20017.DIA (DOI)

Funding

Comunidad de Madrid
Lengua y Derecho PEJD-2018-PRE/HUM-8838

Software

Programming language
XML