Published August 27, 2024 | Version 1.0.0
Poster Open

LAC Data and Metadata Conversion Pipeline: Archivieren am Data Center for the Humanities der Universität zu Köln

  • 1. ROR icon University of Cologne
  • 2. Universität zu Köln

Description

Das Data Center for the Humanities (DCH) bietet über das Language Archive Cologne (LAC) die Sicherung und Publikation audiovisueller Daten an. Im Sinne der FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable) stellt das LAC einen offenen, webbasierten Zugang zu hochwertigen digitalen Sprachressourcen zur Verfügung.

Als ein mit dem CoreTrustSeal (CTS) zertifiziertes Repositorium innerhalb der europäischen Common Language Resources and Technology Infrastructure (CLARIN) arbeitet das LAC nach dokumentierten Arbeitsprozessen, die Qualität und Integrität von Daten und Metadaten sichern.

Das Diagramm dokumentiert formal den Konvertierungsprozess, den Daten und Metadaten nach der Übergabe während der Generierung des Archival Information Package (AIP) durchlaufen, bevor sie ins LAC überführt und publiziert werden.

Zur Datenübergabe gibt es mehrere Optionen: Diese hängen von der Datengröße und dem Zugang der Datengeber*innen zum Cloud-Service Sciebo ab, der vom DCH verwendet wird. Das LAC nutzt das Profil Basic Language Archive Metadata (BLAM) des ISO 24622-Standards Component Metadata Infrastructure (CMDI). Die Datengeber*innen liefern die Metadaten in einem auf das LAC angepasste Excelsheet, das im Rahmen der AIP-Generierung in dieses Profil überführt wird.

Die Architektur des LAC basiert auf dem Oxford Common File Layout (OCFL), für dessen Anforderungen die Ordnerstruktur der überreichten Daten angepasst werden muss: Eine für das LAC spezifische Besonderheit ist hierbei die Unterteilung eines Datensatzes (Collection) in mehrere Bundles. Ein Bundle ist in der Regel äquivalent zu einer Aufnahme(session), zu der jeweils eine Medien- und eine Annotationsdatei zugeordnet werden. Die Datengeber*innen haben die Möglichkeit, der Collection bzw. den Bundles zusätzliche Metadatendateien hinzuzufügen.

Die Generierung des AIP ist Teil des LAC Depositing Workflow: https://doi.org/10.5281/zenodo.13375243.

Files

Archivieren_am_DCH_LAC_Data_&_Metadata_Conversion_Pipeline.pdf

Files (3.1 MB)