Zettelkataloge im Zeitalter künstlicher Intelligenz
Authors/Creators
Description
Die geplante Aussonderung der Zettelkataloge der Staatsbibliothek Berlin hat für die bibliothekarische Provenienzforschung erhebliche Bedeutung. Durch die Makulatur einzigartiger Informationsträger droht ein unwiederbringlicher Verlust wertvoller Informationen. Dies würde für andere deutsche Bibliotheken einen bedauerlichen Präzedenzfall schaffen. Es handelt sich um die umfangreichsten Zettelkataloge der Bundesrepublik, was einerseits Herausforderungen bei der Verarbeitung und Auswertung mit sich bringt. Andererseits bieten Massendaten ein typisches Anwendungsfeld für künstliche Intelligenz, das hier sinnvoll genutzt werden kann.
Aus Sicht der Provenienzforschung ist der Katalog neben Erwerbungsjournalen und Provenienzmerkmalen in den Büchern selbst eine wesentliche Quelle für systematische Provenienzrecherchen. Vielfach liefern handschriftliche Notizen oder zusätzliche Einträge auf den Zetteln unikale und wertvolle Hinweise für Provenienzen. Knapp 50 Jahre alte Mikrofiches können das analoge Original daher nicht ersetzen. Zurückliegende Retrokonversionen haben in ihrer Auswahl bereits zu Datenverlust geführt, der unwiederbringlich wird, sobald die Zettelkataloge nicht mehr vorhanden sind.
Eine erneute, qualitativ ausreichende und vollständige Digitalisierung der Kataloge liegt deshalb nahe. Gleichzeitig ließe sich an dem Bestand exemplarisch zeigen, wie sich diese digitalen Quellen mit KI-Methoden gewinnbringend verarbeiten lassen. Somit stellt eine Digitalisierung nicht nur eine Sicherung der Informationen dar, sondern dient zugleich auch als Grundlage weiterer datengetriebener Forschung.
Anhand konkreter Beispiele soll im Beitrag gezeigt werden, wie typische Provenienzmerkmale in Katalogen aussehen und wie sie sich mit generativer KI identifizieren und extrahieren lassen. Darauf aufbauend lassen sich erste Szenarien für Forschung und Analyse entwickeln. Generative KI liefert somit Informationen, die zwar analog bereits vorhanden waren, zuvor aber nicht nutzbar. Unser Beitrag soll zeigen, wie ein KI-gestützte Verarbeitung der digitalisierten Kataloge mit ihren vielfältigen und für die Forschung wertvollen gedruckten, getippten oder handschriftlichen Informationen erstmalig all diese Bausteine berücksichtigen kann. Neben der textlichen Information können unterschiedliche Schreibmedien und Annotationen extrahiert und klassifiziert werden. Ebenso können Stempel erkannt und ausgelesen werden.
Insbesondere gerade erst neu veröffentlichte KI-Modelle zeigen bedeutende Fortschritte bei der visionbasierten Extraktion von Daten sowie im Umgang mit Kurrentschriften. Diese Daten ermöglichen systematische und quantitative Analysen mit potenziellen Nutzungsmöglichkeiten, die über den Bereich der Provenienzforschung hinausgehen.
Notes (German)
Files
Zettelkataloge20260215.pdf
Files
(49.9 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:39846c4b87897e1de3a7f6330ddd5371
|
49.9 MB | Preview Download |