Verwendung von Wissensgraphen zur inhaltlichen Ergänzung kleinerer Textkorpora

doi:10.5281/zenodo.6328009

Published March 7, 2022 | Version v1

Conference paper Open

Verwendung von Wissensgraphen zur inhaltlichen Ergänzung kleinerer Textkorpora

Hagen, Thora¹

1. Julius-Maximilians-Universität Würzburg

Editors:

1. Universität der Bundeswehr München, Deutschland
2. Universität Potsdam, Deutschland
3. Digital Humanities im deutschsprachigen Raum e.V., Deutschland

Die Korpuserstellung ist einer der essenziellsten Schritte um ein Forschungsvorhaben im Bereich der Digital Humanities durchzuführen. Vor allem für speziellere Domänen (etwa bei der Analyse von Subgenres oder Dialekten) ist allerdings häufig nicht genügend Material verfügbar, um Methoden aus dem NLP Bereich nachnutzen zu können, da diese Gigabytes an Text verlangen. Dieser Aufsatz zeigt wie Wissensgraphen, welche zum Beispiel aus Wörterbüchern erstellt werden können, helfen, kleinere Textkorpora aufzuwerten. In dem hier durchgeführten Experiment wird ein auf 20 Megabytes trainiertes FastText Modell mit den Informationen aus GermaNet angereichert. Das resultierende Modell weist die selbe Performanz auf wie ein einfaches FastText Modell, welches auf etwa dreimal soviel Daten trainiert wurde.

Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.

Files

HAGEN_Thora_Verwendung_von_Wissensgraphen_zur_inhaltlichen_E.pdf

Files (84.1 kB)

Name	Size	Download all
HAGEN_Thora_Verwendung_von_Wissensgraphen_zur_inhaltlichen_E.pdf md5:170d5128eb95e04625f1f8d9fee4a4bf	50.8 kB	Preview Download
HAGEN_Thora_Verwendung_von_Wissensgraphen_zur_inhaltlichen_E.xml md5:685bbdf76edec6c2abbdd7834ca8d91d	33.3 kB	Preview Download

Additional details

Is part of: Book: 10.5281/zenodo.6304590 (DOI)

	All versions	This version
Views	214	214
Downloads	116	116
Data volume	6.3 MB	6.3 MB

Verwendung von Wissensgraphen zur inhaltlichen Ergänzung kleinerer Textkorpora

Creators

Contributors

Editors:

Description

Files

HAGEN_Thora_Verwendung_von_Wissensgraphen_zur_inhaltlichen_E.pdf

Files (84.1 kB)

Additional details

Related works