Published February 26, 2025 | Version v1
Conference paper Open

Algorithmische Korpusarchäologie: Eine Git-basierte Analyse von Korpora als dynamische epistemische Objekte in den Computational Literary Studies

  • 1. Universität Potsdam, Deutschland
  • 1. Universität zu Köln
  • 2. Universität Passau
  • 3. Universität Bielefeld
  • 4. Digital Humanities im deutschsprachigen Raum

Description

Viele Korpora – die zentralen epistemischen Objekte der Computational Literary Studies (Gavin 2023) – werden auf Plattformen wie GitHub entwickelt. Die reichhaltigen Datenspuren die bei der Verwendung eines Versionierungssystems entstehen, werden aber bisher viel zu wenig für die Forschung nutzbar gemacht. Dabei sind sie eine hervorragende Quelle, um die Genese eines Datenbestandes transparent und nachvollziehbar zu machen. Der Poster-Beitrag "Algorithmische Korpusarchäologie" stellt eine Methode und ein Tool zur Analyse der Entstehung des Deutschen Dramenkorpus (GerDraCor) basierend auf der Commit History vor. Das entwickelte Tool ermöglicht beispielsweise eine Visualisierung des "Korpuswachstum" und die Diversifizierung der digitalen Quellen.

Files

B_RNER_Ingo_Algorithmische_Korpusarch_ologie__Eine_Git_basie.pdf

Additional details

Related works

Is part of
Book: 10.5281/zenodo.14887460 (DOI)
Is supplemented by
Poster: 10.5281/zenodo.14944606 (DOI)