KI-gestützte Digitalisierung und Verarbeitung historischer Inventare: Ein Praxisbericht zur Erschließung der Photothek des Zentralinstituts München
Authors/Creators
- 1. Zentralinstitut für Kunstgeschichte: Munchen, Bayern, DE
Description
Die Photothek des Zentralinstituts München verfügt über ein maschinenschriftlich erstelltes Inventar, dessen Ursprünge bis in die 1940er Jahre zurückreichen. Der als Fotothek mit Abbildungen zu allen Epochen und Gattungen der Kunstgeschichte angelegte Bestand umfasst auch Fotodokumentationen des Münchner Central Collecting Point sowie Materialien von in NS-Kulturgutverluste involvierten Institutionen. Weitere Zugänge bildeten – neben systematischen Ankäufen – Kunsthistorikernachlässe und Schenkungen provenienzrelevanter Persönlichkeiten wie Ernst Buchner, Robert Oertel und Erhard Göpel. Ein kontinuierlich bis Ende der 1990er Jahre fortgeführtes Inventar erschließt ca. 695.000 Objekte der Photothek.
Im Rahmen des vom Bayerischen Staatsministeriums für Wissenschaft und Kunst geförderten Infrastrukturprojekts kunst.bild.daten wird das Inventar vollständig digitalisiert und erschlossen. Die ca. 66.000 Seiten erweisen sich jedoch für eine konventionelle zeilenweise OCR-Bearbeitung als ungeeignet. Stattdessen erfordert die Erschließung der bereits digitalisierten bzw. in Digitalisierung befindlichen Fotografien eine strukturierte Datenaufbereitung des
Inventars.
Der Beitrag behandelt den Einsatz von Computer Vision, um strukturierte Daten aus komplexen Layouts zu extrahieren. Prompts ersetzen in dem Verfahren komplexe Algorithmen, indem sie Ausgangsmaterial und gewünschtes Ergebnis beschreiben und die Transformation dem Modell übertragen. Besonders reflektiert wird, wie automatisierte Verfahren und "Human-in-the-Loop"-Anteile im Workflow und bei der Qualitätssicherung zusammenspielen. Das bedeutet konkret: Wir setzen auf OCR-freie Verfahren und multimodale Systeme zur Datenextraktion. Im weiteren Vorgehen können Sprachmodelle oder Bibliotheken wie FAISS dazu verwendet werden, die extrahierten Daten über Normlisten und Referenzdaten im Wechselspiel mit manueller Prüfung weiter zu verbessern und zu vereinheitlichen. Erst durch diese stufenweisen Prozesse kommen wir zu einer Normdatenanreicherung und zu einer Datenqualität, die für den eigenen Knowledge Graphen tauglich ist.
Die entwickelte Methodik ist dabei auf andere Sammlungen übertragbar und liefert einen systematischen Ansatz zur KI-gestützten Erschließung historischer Inventare.
Diese Präsentation ist im Rahmen der Tagung "Digital Turn. Sammlungen – Provenienzen – Märkte", die am 27. und 28. November 2025 an der Humboldt-Universität zu Berlin stattfand, entstanden.
Files
digital_turn_schelbert_bussche_publikationsversion.pdf
Files
(7.9 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:8002c5deffaf4deeab13605b8e56c494
|
7.9 MB | Preview Download |