Published February 20, 2026
| Version v1
Conference paper
Open
Struktur für Heterogenität: Ansätze zur Datenintegration und nachhaltigen Infrastruktur am Beispiel der neuen VICAV-Plattform
Authors/Creators
- 1. Austrian Centre for Digital Humanities, Österreich
Contributors
Data managers:
- 1. Universität Bielefeld
- 2. Universität Wien
- 3. Digital Humanities im deutschsprachigen Raum
- 4. Universität zu Köln
- 5. Universität Trier
Description
Das Vienna Corpus of Arabic Varieties (VICAV) ist eine digitale Plattform zur langfristigen Dokumentation und Analyse arabischer Dialekte. Aufbauend auf offenen Standards wie der Text Encoding Initiative (TEI) integriert VICAV heterogene Sprachressourcen aus mehreren drittmittelfinanzierten Projekten, darunter Korpora, Wörterbücher, Sprachprofile und linguistische Merkmalslisten. Die technische Infrastruktur basiert auf modularen, XML-basierten Werkzeugen und einer modernen Webapplikation, die eine flexible und nachhaltige Nutzung der Daten ermöglicht. Besonders hervorzuheben sind die Umsetzung eines einheitlichen Kodierungsmodells, die Erweiterung um innovative lexikografische Standards (TEI Lex-0) sowie die Integration komplex annotierter Korpusdaten. VICAV bietet umfassende Tools zur Exploration und vergleichenden Analyse arabischer Varietäten und stellt damit einen wichtigen Beitrag zur arabistischen Sprachdokumentation dar. Die Plattform wird kontinuierlich erweitert und gewährleistet durch offene Schnittstellen und moderne Softwarearchitektur langfristige Verfügbarkeit und Wartbarkeit.
Files
SRAM__Kinga_Struktur_f_r_Heterogenit_t__Ans_tze_zur_Datenint.pdf
Files
(171.1 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:750eeee2564b5db251283173917574c5
|
132.7 kB | Preview Download |
|
md5:29b76c5a8753fa81887b2a885f2d61cd
|
38.4 kB | Preview Download |
Additional details
Related works
- Is part of
- Book: 10.5281/zenodo.18591948 (DOI)