Daten der Citizen Science für die Wissenschaft? Kontrollierte Vokabulare als Herausforderung und Chance für die Auswertung und Qualitätsverbesserung von Massendaten. Die crowdbasierte Datensammlung von Adressbucheinträgen des Vereins für Computergenealogie im Qualitätstest
Creators
- 1. Historisches Datenzentrum Sachsen-Anhalt, Martin-Luther-Universität Halle-Wittenberg, Halle (Saale), Deutschland
- 2. Institut für Geschichte, Martin-Luther-Universität Halle-Wittenberg, Halle (Saale), Deutschland
Description
Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023.
Abstract: Der Artikel beschäftigt sich mit der wissenschaftlichen Verwendung, Qualitätsprüfung und Anreicherung von usergenerierten, webbasierten Datenbanken. Am Beispiel der 10,5 Mio. Einträge umfassenden Adressbuchdatenbank des Vereins für Computergenealogie wird erörtert, welche Vor- und Nachteile normierte und nichtnormierte Dateneingaben besitzen. Anhand des Geschichtlichen Ortsverzeichnisses (GOV) und der Ontologie der historischen, deutschsprachigen Amts- und Berufsbezeichnungen (OhdAB) wird demonstriert, welche Bedeutung kontrollierte Vokabulare, Normdaten und Taxonomien für die Auswertung von Massendaten besitzen und welche Herausforderungen sich beim Matching mit verschiedenen KI-Technologien ergeben. Anhand einiger Ergebnisse wird gezeigt, dass Vokabulare eine hervorragende Möglichkeit bieten, Daten anzureichern und zu kontextualisieren. Gleichzeitig ergänzen sie KI-Verfahren mit ihren eher auf Distant Reading-Strategien (Mustererkennung) ausgerichteten Analysemöglichkeiten um Verfahren des Close Readings und unterstützen damit gezielt die Beantwortung von Fragestellungen analog zu hermeneutischen Strategien.
Files
Moeller-Daten der Citizien Science_v1_0.pdf
Files
(958.1 kB)
Name | Size | Download all |
---|---|---|
md5:d419f52bbddf9e294ff0b03bf2ec7af4
|
958.1 kB | Preview Download |
Additional details
Related works
- Is part of
- Book: 10.5281/zenodo.8319631 (DOI)