Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines
Authors/Creators
- 1. Université de Strasbourg
- 2. Univesité de Strasbourg
Description
Nous présentons des travaux en cours vers la création d’un corpus diachronique de pièces de théâtre en alsacien pour la période 1870-1940, publiquement disponible, encodé selon les recommandations de la Text Encoding Initiative (TEI) et suivant les principes FAIR pour la création de données de la recherche. Le corpus sera utile aux recherches en sociolinguistique historique et analyse dramatique. Nous décrivons le travail effectué en vue des pratiques FAIR et introduisons des questions de recherche en modélisation TEI de variables pertinentes pour l’analyse linguistique et dramatique. De façon générale, la création du corpus est un exemple des difficultés du travail avec les langues peu dotées. Particulièrement, le corpus présente de l’alternance codique et d’énormes défis pour la normalisation orthographique automatique, sur lesquels nous aimerions échanger avec la communauté.
Files
methal_fair_actes_lift.pdf
Files
(410.9 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:7dc43dce29be54c88d20e92edeacfdaa
|
410.9 kB | Preview Download |