Generische und disziplinspezifische Zugänge zur Qualität audiovisueller, annotierter Sprachdaten im BMBF-Projekt QUEST
Contributors
- 1. Data Center for the Humanities, Universität zu Köln
- 2. Cologne Center for eHumanities, Universität zu Köln
- 3. Institut für Digital Humanities, Universität zu Köln
Description
In diesem Beitrag stellen wir mit dem BMBF-Verbundprojekt QUEST einen Ansatz zur Bestimmung der Nachnutzbarkeit von audiovisuellen, annotierten Sprachdaten vor. Der Fokus des Vorhabens liegt auf Forschungsdaten, die im Rahmen empirischer Forschung in den Bereichen Sprachdokumentation, Sprachkontakt- und Mehrsprachigkeitsforschung entstehen. Zur Evaluierung des Nachnutzungspotentials solcher Sprachdaten sollen einerseits generisch ausgerichtete datentechnische und dokumentatorische Standards für die verschiedenen relevanten Ressourcentypen sowie deren Metadaten und andererseits disziplinspezifische Kurationskriterien, die auf bestimmte Nachnutzungsszenarien ausgerichtet sind, entwickelt werden. In Bezug auf die sprachwissenschaftliche Sekundärnutzung mehrsprachiger Daten werden für die spezifischen Nachnutzungsszenarien 'Lernerkorpora' und Korpora gedolmetschter Gespräche beispielsweise Evaluationskriterien für die Übersetzung entwickelt und Fragen nach Metadatenstandards behandelt. Im Rahmen einer Erprobung von Methoden der Qualitätssicherung im Bereich heterogener digitaler Sprachdaten strebt das Forschungsvorhaben an, die Prüfung von Qualitätsstandards und Kurationskriterien als datentechnische Dienstleistung anzubieten. Dazu wird für ausgewählte Ressourcentypen zum Projektende ein System der automatischen kontinuierlichen Qualitätskontrolle implementiert.
Files
P05_Wamprechtshammer_Arestau_QUEST.pdf
Files
(121.9 kB)
Name | Size | Download all |
---|---|---|
md5:ab058581112d479a34b6c2313db0a43b
|
121.9 kB | Preview Download |
Additional details
Related works
- Is part of
- Book: 10.5281/zenodo.5289381 (DOI)
- Is supplemented by
- Poster: 10.5281/zenodo.5285225 (DOI)