Conference paper Open Access

Kontrastive Textanalyse mit pydistinto - Ein Python-Paket zur Nutzung unterschiedlicher Distinktivitätsmaße

Du, Keli; Dudar, Julia; Rok, Cora; Schöch, Christof

Editor(s)
Geierhos, Michaela; Trilcke, Peer; Börner, Ingo; Seifert, Sabine; Busch, Anna; Helling, Patrick

In den Computational Literary Studies (CLS) werden statistische Distinktivitätsmaße eingesetzt, um Features zu bestimmen, die charakteristisch für eine Textgruppe im Vergleich mit einer anderen Textgruppe sind. Allerdings erweisen sich die meisten vorhandenen Tools als ungeeignet, wenn Nutzer:innen ihre Analysen anpassen und eigene Parametereinstellungen vornehmen oder bestimmte Datenformate nutzen wollen. Um den Einsatz relevanter Maße für die kontrastive Textanalyse zu erleichtern und das Bewusstsein für die Vielfalt der Maße zu schärfen, entwickeln wir ein Python-Paket mit dem Namen pydistinto. Mithilfe von pydistinto können Nutzer:innen auch mit geringen Programmier- und Statistikkenntnissen zwei Textkorpora mit unterschiedlichen Maßen miteinander vergleichen, und in einem fortgeschrittenen Modus auch die Eigenschaften und Leistungsfähigkeit der unterschiedlichen Maße empirisch ermitteln und gegenüberstellen. Durch Tabellen und Abbildungen werden in dem geplanten Poster vor allem die folgenden Aspekte unseres Pakets vorgestellt: die Möglichkeiten der Vorverarbeitung der Textdaten, die implementierten Distinktivitätsmaße und die Visualisierung der kontrastiven Analyseergebnisse.

Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.

Files (32.1 kB)
Name Size
DU_Keli_Kontrastive_Textanalyse_mit_pydistinto___Ein_Python_.pdf
md5:552fd39962b8316fb26757cbb1131322
13.7 kB Download
DU_Keli_Kontrastive_Textanalyse_mit_pydistinto___Ein_Python_.xml
md5:65bcb556fb0a7ec7ac2c86a8b73efe2f
18.4 kB Download
97
46
views
downloads
All versions This version
Views 9797
Downloads 4646
Data volume 630.0 kB630.0 kB
Unique views 9191
Unique downloads 4343

Share

Cite as