Historische Textnormalisierung: Herausforderungen und Potentiale von Deep Learning

Ehrmanntraut, Anton; Bracke, Yannic

doi:10.5281/zenodo.14943042

Published February 26, 2025 | Version v1

Conference paper Open

Historische Textnormalisierung: Herausforderungen und Potentiale von Deep Learning

1. Julius-Maximilians-Universität Würzburg, Deutschland
2. Berlin-Brandenburgische Akademie der Wissenschaften, Deutschland

Contributors

Data manager (6):

Editor (5):

1. Universität zu Köln
2. Universität Passau
3. Universität Bielefeld
4. Digital Humanities im deutschsprachigen Raum

Historische Dokumente bergen Herausforderungen für die Digital Humanities, da ältere Texte in ihrer Rechtschreibung von der modernen Standardsprache abweichen. Das erschwert die Nutzung und Verarbeitung solcher Texte, z. B. bei Volltextsuche oder Natural Language Processing. Eine Lösung bietet die automatisierte historische Textnormalisierung, die historische Schreibweisen in moderne Standardschreibung übersetzt. Dieser Beitrag untersucht das Potential moderner NLP-Methodik auf Basis von Machine Learning und Transformer-Modellen für die historische Textnormalisierung, und vergleicht diese in einer Fallstudie mit CAB, dem de-facto Standard-Tool für deutsche Textnormalisierung. Damit werden die aktuellen Möglichkeiten und Grenzen automatischer Textnormalisierung aufgezeigt, besonders im Hinblick auf die Bereitstellung von offen zugänglichen Modellen.

Files

EHRMANNTRAUT_Anton_Historische_Textnormalisierung__Herausfor.pdf

Files (262.1 kB)

Name	Size	Download all
EHRMANNTRAUT_Anton_Historische_Textnormalisierung__Herausfor.pdf md5:3e9de82027bcc6d355469d4c939ccd10	221.9 kB	Preview Download
EHRMANNTRAUT_Anton_Historische_Textnormalisierung__Herausfor.xml md5:f16bf08d33e40334790d8b9c8034569d	40.3 kB	Preview Download

Additional details

Is part of: Book: 10.5281/zenodo.14887460 (DOI)

	All versions	This version
Views	121	121
Downloads	120	120
Data volume	23.4 MB	23.4 MB

Historische Textnormalisierung: Herausforderungen und Potentiale von Deep Learning

Authors/Creators

Contributors

Data manager (6):

Editor (5):

Description

Files

EHRMANNTRAUT_Anton_Historische_Textnormalisierung__Herausfor.pdf

Files (262.1 kB)

Additional details

Related works