Historische Textnormalisierung: Herausforderungen und Potentiale von Deep Learning

Bracke, Yannic; Ehrmanntraut, Anton

doi:10.5281/zenodo.14983283

Published March 6, 2025 | Version v1

Presentation Open

Historische Textnormalisierung: Herausforderungen und Potentiale von Deep Learning

1. Berlin-Brandenburgische Akademie der Wissenschaften

Historische Dokumente bergen Herausforderungen für die Digital Humanities, da ältere Texte in ihrer Rechtschreibung von der modernen Standardsprache abweichen. Das erschwert die Nutzung und Verarbeitung solcher Texte, z. B. bei Volltextsuche oder Natural Language Processing. Eine Lösung bietet die automatisierte historische Textnormalisierung, die historische Schreibweisen in moderne Standardschreibung übersetzt. Dieser Beitrag untersucht das Potential moderner NLP-Methodik auf Basis von Machine Learning und Transformer-Modellen für die historische Textnormalisierung, und vergleicht diese in einer Fallstudie mit CAB, dem de-facto Standard-Tool für deutsche Textnormalisierung. Damit werden die aktuellen Möglichkeiten und Grenzen automatischer Textnormalisierung aufgezeigt, auch im Hinblick auf die Bereitstellung von offen zugänglichen Modellen.

Files

BrackeEhrmanntraut_2025_HistTextnorm_Folien.pdf

Files (1.4 MB)

Name	Size	Download all
BrackeEhrmanntraut_2025_HistTextnorm_Folien.pdf md5:f41182db6a4c9fb03b30058bc1ecf7e5	1.4 MB	Preview Download

Additional details

Available: 2025-03-06

Views

Downloads

Show more details

	All versions	This version
Views	62	62
Downloads	74	74
Data volume	121.8 MB	121.8 MB

More info on how stats are collected....

DOI

Resource type

Presentation

Publisher

Zenodo

Conference

11. Jahrestagung des Verbands »Digital Humanities im deutschsprachigen Raum« (DHd) , Bielefeld, 03-07 March 2025 (Session Digital History I, Part 3)

Languages

German

License: Creative Commons Attribution 4.0 International

The Creative Commons Attribution license allows re-distribution and re-use of a licensed work on the condition that the creator is appropriately credited. Read more

Technical metadata

Created: March 8, 2025
Modified: March 8, 2025

Historische Textnormalisierung: Herausforderungen und Potentiale von Deep Learning

Creators

Description

Files

BrackeEhrmanntraut_2025_HistTextnorm_Folien.pdf

Files (1.4 MB)

Additional details

Dates