Published February 20, 2026 | Version v1
Conference paper Open

Struktur für Heterogenität: Ansätze zur Datenintegration und nachhaltigen Infrastruktur am Beispiel der neuen VICAV-Plattform

  • 1. Universität Bielefeld
  • 2. Universität Wien
  • 3. Digital Humanities im deutschsprachigen Raum
  • 4. Universität zu Köln
  • 5. Universität Trier

Description

Das Vienna Corpus of Arabic Varieties (VICAV) ist eine digitale Plattform zur langfristigen Dokumentation und Analyse arabischer Dialekte. Aufbauend auf offenen Standards wie der Text Encoding Initiative (TEI) integriert VICAV heterogene Sprachressourcen aus mehreren drittmittelfinanzierten Projekten, darunter Korpora, Wörterbücher, Sprachprofile und linguistische Merkmalslisten. Die technische Infrastruktur basiert auf modularen, XML-basierten Werkzeugen und einer modernen Webapplikation, die eine flexible und nachhaltige Nutzung der Daten ermöglicht. Besonders hervorzuheben sind die Umsetzung eines einheitlichen Kodierungsmodells, die Erweiterung um innovative lexikografische Standards (TEI Lex-0) sowie die Integration komplex annotierter Korpusdaten. VICAV bietet umfassende Tools zur Exploration und vergleichenden Analyse arabischer Varietäten und stellt damit einen wichtigen Beitrag zur arabistischen Sprachdokumentation dar. Die Plattform wird kontinuierlich erweitert und gewährleistet durch offene Schnittstellen und moderne Softwarearchitektur langfristige Verfügbarkeit und Wartbarkeit.

Files

SRAM__Kinga_Struktur_f_r_Heterogenit_t__Ans_tze_zur_Datenint.pdf

Additional details

Related works

Is part of
Book: 10.5281/zenodo.18591948 (DOI)