Published October 10, 2022
| Version v1
Poster
Open
Text-Mining-Pipelines für unstrukturierten Text
Creators
- 1. SUB Göttingen / Göttingen Centre for Digital Humanities
- 2. SUB Göttingen
- 3. GWDG - Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen
Description
Dieses Poster wurde auf dem Text+ Plenary (12 / 13. September 2022) in Mannheim vorgestellt. Es ist der Task Area / Datendomäne "Collections" zugeordnet und zeigt erste Ergebnisse des Clusters "Unstructured Text" aus dem Bereich der Bibliotheken. Es wird ein Workflow zur Verarbeitung von unstrukturiertem Text aus Göttinger Repositories und Text-Collections vorgestellt, der Komponenten zur Metadatenanreicherung ("Corpus Reader"), Erschließung von Strukturinformationen auf Textebene ("Natural Language Processing Pipeline") sowie zur Einbindung in eine Text-Mining-Plattform ("MINE") beinhaltet.
Files
Col_Text-Mining-Pipelines_Barth_Calvo Tello_Funk_Göbel_Kurzawe_Rißler-Pipka_Veentjer.pdf
Files
(1.6 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:153e6b1e4131aa374c2386e5016d7185
|
1.6 MB | Preview Download |