Conference paper Open Access

Evaluation computergestützter Verfahren der Emotionsklassifikation für deutschsprachige Dramen um 1800

Schmidt, Thomas; Dennerlein, Katrin; Wolff, Christian

Editor(s)
Geierhos, Michaela; Trilcke, Peer; Börner, Ingo; Seifert, Sabine; Busch, Anna; Helling, Patrick

Wir präsentieren die Ergebnisse einer Evaluationsstudie zum Einsatz unterschiedlicher Verfahren des maschinellen Lernens für die Emotionsklassifikation auf historischen deutschen Dramen um 1800. Der Fokus liegt dabei auf Transformer-basierten Sprachmodellen wie BERT und ELECTRA vortrainiert auf zeitgenössischer und historischer Sprache. Als Gold Standard werden 5 Dramen des genannten Zeitraums bezüglich mehrerer Emotionskategorien annotiert. Die Evaluationsergebnisse zeigen, dass Transformer-basierte Modelle bessere Erkennungsraten erreichen als Baseline-Methoden wie lexikonbasierte Verfahren, bag-of-words-Ansätze oder statische Sprachmodelle. Für die Klassifikation der Polarität (positiv/negativ) wird eine Erkennungsrate von 83% erreicht. Die Erkennungsrate wird jedoch mit zunehmender Emotionszahl geringer. Historische Domänenadaption führt selten zu geringfügigen Verbesserungen in unserem Setting. Die besten Modelle sind hingegen die größten Sprachmodelle trainiert auf zeitgenössischer Sprache. Wir diskutieren unsere Ergebnisse und Impulse für die weitere Verbesserung.

Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.

Files (1.4 MB)
Name Size
SCHMIDT_Thomas_Evaluation_computergest_tzter_Verfahren_der_E.pdf
md5:b2f37d194a581c437e4f42dc0649fd5d
1.4 MB Download
SCHMIDT_Thomas_Evaluation_computergest_tzter_Verfahren_der_E.xml
md5:344da4a936186ef882048cac1fb0b05b
57.1 kB Download
121
71
views
downloads
All versions This version
Views 121121
Downloads 7171
Data volume 96.2 MB96.2 MB
Unique views 112112
Unique downloads 6565

Share

Cite as