Published October 10, 2022 | Version v1
Poster Open

Text-Mining-Pipelines für unstrukturierten Text

  • 1. SUB Göttingen / Göttingen Centre for Digital Humanities
  • 2. SUB Göttingen
  • 3. GWDG - Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen

Description

Dieses Poster wurde auf dem Text+ Plenary (12 / 13. September 2022) in Mannheim vorgestellt. Es ist der Task Area / Datendomäne "Collections" zugeordnet und zeigt erste Ergebnisse des Clusters "Unstructured Text" aus dem Bereich der Bibliotheken. Es wird ein Workflow zur Verarbeitung von unstrukturiertem Text aus Göttinger Repositories und Text-Collections vorgestellt, der Komponenten zur Metadatenanreicherung ("Corpus Reader"), Erschließung von Strukturinformationen auf Textebene ("Natural Language Processing Pipeline") sowie zur Einbindung in eine Text-Mining-Plattform ("MINE") beinhaltet.

Files

Col_Text-Mining-Pipelines_Barth_Calvo Tello_Funk_Göbel_Kurzawe_Rißler-Pipka_Veentjer.pdf