Published February 26, 2025 | Version v1
Conference paper Open

Korpus 4.0 - Ein innovativer Workflow zur Erstellung eines Korpus wissenschaftlicher Texte

  • 1. Universitäts- und Landesbibliothek Darmstadt, Deutschland
  • 1. Universität zu Köln
  • 2. Universität Passau
  • 3. Universität Bielefeld
  • 4. Digital Humanities im deutschsprachigen Raum

Description

Im Rahmen des DFG-geförderten Projekts Workflow Digitale Medien arbeitet die Universitäts- und Landesbibliothek Darmstadt daran, ein Korpus aus wissenschaftlicher Open-Access-Literatur in einem einheitlich strukturierten TEI/XML-Format über frei zugängliche Schnittstellen bereitzustellen. Forschende sollen die Möglichkeit erhalten, alle Arten wissenschaftlicher Dokumente, zum Beispiel Zeitschriftenartikel, E-Books oder Konferenzbände, in großen Mengen über diese Schnittstellen abzurufen, um sie anschließend beispielsweise für Text- und Data-Mining-Analysen nutzen zu können. Zusätzlich zu den Texten werden alle für den Workflow entwickelten Konzepte und Skripte Open Source zur Verfügung gestellt, um deren Nachnutzbarkeit zu gewährleisten. Im vorliegenden Vortrag wird ein Überblick über den Workflow, die Datengrundlage und Zugriffsmöglichkeiten sowie den aktuellen Entwicklungsstand des Projekts gegeben.

Files

KALMER_Silke_Korpus_4_0___Ein_innovativer_Workflow_zur_Erste.pdf

Additional details

Related works

Is part of
Book: 10.5281/zenodo.14887460 (DOI)