Published September 27, 2023 | Version v1.0
Book chapter Open

Daten der Citizen Science für die Wissenschaft? Kontrollierte Vokabulare als Herausforderung und Chance für die Auswertung und Qualitätsverbesserung von Massendaten. Die crowdbasierte Datensammlung von Adressbucheinträgen des Vereins für Computergenealogie im Qualitätstest

  • 1. Historisches Datenzentrum Sachsen-Anhalt, Martin-Luther-Universität Halle-Wittenberg, Halle (Saale), Deutschland
  • 2. Institut für Geschichte, Martin-Luther-Universität Halle-Wittenberg, Halle (Saale), Deutschland

Description

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023.

Abstract: Der Artikel beschäftigt sich mit der wissenschaftlichen Verwendung, Qualitätsprüfung und Anreicherung von usergenerierten, webbasierten Datenbanken. Am Beispiel der 10,5 Mio. Einträge umfassenden Adressbuchdatenbank des Vereins für Computergenealogie wird erörtert, welche Vor- und Nachteile normierte und nichtnormierte Dateneingaben besitzen. Anhand des Geschichtlichen Ortsverzeichnisses (GOV) und der Ontologie der historischen, deutschsprachigen Amts- und Berufsbezeichnungen (OhdAB) wird demonstriert, welche Bedeutung kontrollierte Vokabulare, Normdaten und Taxonomien für die Auswertung von Massendaten besitzen und welche Herausforderungen sich beim Matching mit verschiedenen KI-Technologien ergeben. Anhand einiger Ergebnisse wird gezeigt, dass Vokabulare eine hervorragende Möglichkeit bieten, Daten anzureichern und zu kontextualisieren. Gleichzeitig ergänzen sie KI-Verfahren mit ihren eher auf Distant Reading-Strategien (Mustererkennung) ausgerichteten Analysemöglichkeiten um Verfahren des Close Readings und unterstützen damit gezielt die Beantwortung von Fragestellungen analog zu hermeneutischen Strategien.

Files

Moeller-Daten der Citizien Science_v1_0.pdf

Files (958.1 kB)

Name Size Download all
md5:d419f52bbddf9e294ff0b03bf2ec7af4
958.1 kB Preview Download

Additional details

Related works

Is part of
Book: 10.5281/zenodo.8319631 (DOI)