SURel: Synchronic Usage Relatedness
Authors/Creators
- 1. University of Stuttgart
Description
-------------------------------------
Siehe unten für die deutsche Version.
-------------------------------------
Synchronic Usage Relatedness (SURel) - Test Set and Annotation Data
This data collection supplementing the paper referenced below contains:
- a semantic meaning shift test set with 22 German lexemes with different degrees of meaning shifts from general language to the domain of cooking. It comes as a tab-separated csv file where each line has the form
lemma POS translations mean relatedness score frequency GEN frequency SPEC
The 'mean relatedness score' denotes the annotation-based measure of semantic shift described in the paper. 'frequency GEN' and 'frequency SPEC' list the frequencies of the target words in the general language corpus (GEN) and the domain-specific cooking corpus (SPEC). 'translations' gives English translations for different senses, illustrating possible meaning shifts. Note that further senses might exist;
- the full annotation tables as annotators received it filled it. The tables come in the form of a tab-separated csv file where each line has the form
sentence 1 rating comment sentence 2;
- the annotation guidelines in English and German (only the German version was used);
- data visualization plots.
Find more information in
Anna Hätty, Dominik Schlechtweg, Sabine Schulte im Walde. 2019. SURel: A Gold Standard for Incorporating Meaning Shifts into Term Extraction. In Proceedings of the Eighth Joint Conference on Lexical and Computational Semantics (*SEM). Minneapolis, Minnesota USA 2019.
Dominik Schlechtweg, Sabine Schulte im Walde, Stefanie Eckmann. 2018. Diachronic Usage Relatedness (DURel): A Framework for the Annotation of Lexical Semantic Change. In Proceedings of the Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL HLT). New Orleans, Louisiana USA 2018.
The resources are freely available for education, research and other non-commercial purposes. More information can be requested via email to the authors.
-------
Deutsch
-------
Synchroner Wortverwendungsbezug (SURel) - Test Set und Annotationsdaten
Diese Datensammlung ergänzt den unten zitierten Artikel und enthält folgende Dateien:
- ein Test Set für semantische Bedeutungsverschiebung mit 22 deutschen Lexemen, mit unteschiedlichen Graden an Bedeutungsverschiebungen von der Allgemeinsprache hin zur domänenspezifischen Sprache des Kochens. Hierbei handelt es sich um eine tab-separierte CSV-Datei, in der jede Zeile folgende Form hat:
Lexem Wortart Übersetzungen Mean Relatedness Score Freqeunz GEN Frequenz SPEC
Der 'Mean Realtedness Score' bezeichnet das annotationsbasierte Maß für Bedeutungsverschiebungen wie im Paper beschrieben. 'Frequenz GEN' und 'Frequenz SPEC' listen die Häufigkeiten der Zielwörter im allgemeinsprachlichen Korpus (GEN) und im domänenspezifischen Korpus (SPEC) auf. 'Übersetzungen' enthält englische Übersetzungen für mögliche Bedeutungen um die Bedeutungsverschiebung zu illustrieren. Beachten Sie dass auch andere Bedeutungen exitieren können;
- Die Annotationstabellen, wie sie die Annotatoren erhalten aus ausgefüllt haben. Die Ergebnistabellen sind tab-separierte CSV-Dateien, in der jede Zeile folgende Form hat:
Satz 1 Bewertung Kommentar Satz 2
- die Annotationsrichtlinien auf Deutsch und Englisch (nur die deutsche Version wurde genutzt);
- Visualisierungsplots der Daten.
Mehr Informationen finden Sie in
Anna Hätty, Dominik Schlechtweg, Sabine Schulte im Walde. 2019. SURel: A Gold Standard for Incorporating Meaning Shifts into Term Extraction. In Proceedings of the Eighth Joint Conference on Lexical and Computational Semantics (*SEM). Minneapolis, Minnesota USA 2019.
Dominik Schlechtweg, Sabine Schulte im Walde, Stefanie Eckmann. 2018. Diachronic Usage Relatedness (DURel): A Framework for the Annotation of Lexical Semantic Change. In Proceedings of the Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL HLT). New Orleans, Louisiana USA 2018.
Die Ressourcen sind frei verfügbar für Lehre, Forschung sowie andere nicht-kommerzielle Zwecke. Für weitere Informationen schreiben Sie bitte eine E-Mail an die Autoren.
Notes
Files
SURel.zip
Files
(3.0 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:e5f8599ae4b9d2832831a392b9071476
|
3.0 MB | Preview Download |
Additional details
Related works
- Is published in
- Conference paper: 10.18653/v1/S19-1001 (DOI)
- Is referenced by
- Conference paper: arXiv:2007.11464 (arXiv)
- Conference paper: arXiv:2104.08540 (arXiv)
- Is supplement to
- Conference paper: 10.18653/v1/N18-2027 (DOI)
- Dataset: 10.5281/zenodo.5541340 (DOI)