Published December 10, 2020 | Version v1
Conference paper Open

Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines

  • 1. Université de Strasbourg
  • 2. Univesité de Strasbourg

Description

Nous présentons des travaux en cours vers la création d’un corpus diachronique de pièces de théâtre en alsacien pour la période 1870-1940, publiquement disponible, encodé selon les recommandations de la Text Encoding Initiative (TEI) et suivant les principes FAIR pour la création de données de la recherche. Le corpus sera utile aux recherches en sociolinguistique historique et analyse dramatique. Nous décrivons le travail effectué en vue des pratiques FAIR et introduisons des questions de recherche en modélisation TEI de variables pertinentes pour l’analyse linguistique et dramatique. De façon générale, la création du corpus est un exemple des difficultés du travail avec les langues peu dotées. Particulièrement, le corpus présente de l’alternance codique et d’énormes défis pour la normalisation orthographique automatique, sur lesquels nous aimerions échanger avec la communauté.

Files

methal_fair_actes_lift.pdf

Files (410.9 kB)

Name Size Download all
md5:7dc43dce29be54c88d20e92edeacfdaa
410.9 kB Preview Download