Published March 7, 2022 | Version v1
Conference paper Open

Literaturgeschichtsschreibung datenbasiert und wikifiziert? Automatische Extraktion thematischer Statements aus französischen Primärtexten mithilfe von Topic Modeling, RDF und eines kontrollierten Vokabulars in LOD

  • 1. Universität Trier, Germany
  • 1. Universität der Bundeswehr München, Deutschland
  • 2. Universität Potsdam, Deutschland
  • 3. Digital Humanities im deutschsprachigen Raum e.V., Deutschland

Description

Lässt sich Literaturgeschichtsschreibung in Form von Daten-Tripeln formalisieren? Das Projekt MiMoText erstellt einen Knowledge Graphen, der sich aus verschiedenen Textsorten speist. Im Rahmen eines Pilotprojekts wurden aus 92 französischen Primärtexten 1750-1800 mithilfe von Topic Modeling 30 Topics extrahiert und auf multilinguale, thematische Konzepte eines kontrollierten Vokabulars gemappt. Gleichzeitig wurden aus ca. 2700 bibliographischen Einträgen thematische Schlagworte extrahiert und diesem kontrollierten Vokabular an Themen der französischen Literatur des 18. Jahrhunderts zugeordnet. Welche Themen-Cluster des französischen Romans der Aufklärung hat der Algorithmus im Gegensatz zur menschlichen Lektüre identifiziert? Der vorgestellte Workflow beschreibt die Informationsextraktion, die Modellierung in RDF und das Endergebnis mit beispielhaften SPARQL-Abfragen.

Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.

Files

R_TTGERMANN_Julia_Literaturgeschichtsschreibung_datenbasiert.pdf

Additional details

Related works

Is part of
Book: 10.5281/zenodo.6304590 (DOI)