Published February 26, 2025 | Version v1
Conference paper Open

Zum Aufbau digitaler Dramenkorpora. OCR4alltoDraCorTEI als Baustein für die Edition von maschinenlesbaren Versionen historischer Dramendrucke

  • 1. Julius-Maximilians-Universität Würzburg, Deutschland
  • 1. Universität zu Köln
  • 2. Universität Passau
  • 3. Universität Bielefeld
  • 4. Digital Humanities im deutschsprachigen Raum

Description

Die verfügbaren digitalisierten Dramenkorpora spiegeln Verzerrungen der Dramengeschichtsschreibung der letzten Jahrzehnte wider. Für die Dramengeschichte des 17.-19. Jahrhunderts fehlen besonders Libretti, populäre Komödien, Dramen von Frauen und Übersetzungen, obwohl diese zahlreich und einflussreich waren. Um Korpora für die Computational Literary Studies (CLS) valide zu erweitern und die historische Diversität besser abzubilden, sollten in Zukunft zahlreiche historische Dramentexte volltextdigitalisiert werden. Herausforderungen sind dabei die Frakturschrift und Druckbesonderheiten. Derzeit fehlt es sowohl an einheitlichen Editionsrichtlinien als auch an Skripten zur Konvertierung von OCR-Software zu DraCorTEI. Im Beitrag werden Vorschläge für editorische Richtlinien und zur Digitalisierung mit der freien Software OCR4all gemacht. Zudem wird ein Open Access Python-Skript vorgestellt, das Dramen, die mit OCR4all ausgezeichnet wurden, in DraCorTEI umwandelt.

Files

DENNERLEIN_Katrin_Zum_Aufbau_digitaler_Dramenkorpora__OCR4al.pdf

Additional details

Related works

Is part of
Book: 10.5281/zenodo.14887460 (DOI)