Published February 26, 2025
| Version v1
Conference paper
Open
Korpus 4.0 - Ein innovativer Workflow zur Erstellung eines Korpus wissenschaftlicher Texte
- 1. Universitäts- und Landesbibliothek Darmstadt, Deutschland
Contributors
Data managers:
- 1. Universität zu Köln
- 2. Universität Passau
- 3. Universität Bielefeld
- 4. Digital Humanities im deutschsprachigen Raum
Description
Im Rahmen des DFG-geförderten Projekts Workflow Digitale Medien arbeitet die Universitäts- und Landesbibliothek Darmstadt daran, ein Korpus aus wissenschaftlicher Open-Access-Literatur in einem einheitlich strukturierten TEI/XML-Format über frei zugängliche Schnittstellen bereitzustellen. Forschende sollen die Möglichkeit erhalten, alle Arten wissenschaftlicher Dokumente, zum Beispiel Zeitschriftenartikel, E-Books oder Konferenzbände, in großen Mengen über diese Schnittstellen abzurufen, um sie anschließend beispielsweise für Text- und Data-Mining-Analysen nutzen zu können. Zusätzlich zu den Texten werden alle für den Workflow entwickelten Konzepte und Skripte Open Source zur Verfügung gestellt, um deren Nachnutzbarkeit zu gewährleisten. Im vorliegenden Vortrag wird ein Überblick über den Workflow, die Datengrundlage und Zugriffsmöglichkeiten sowie den aktuellen Entwicklungsstand des Projekts gegeben.
Files
KALMER_Silke_Korpus_4_0___Ein_innovativer_Workflow_zur_Erste.pdf
Files
(193.4 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:2dc62065e807623345014202746f8e50
|
165.7 kB | Preview Download |
|
md5:c85ad8288f2b90fb845e4ff2d468e9d4
|
27.7 kB | Preview Download |
Additional details
Related works
- Is part of
- Book: 10.5281/zenodo.14887460 (DOI)