Published July 5, 2016 | Version download from KB.nl on 25-11-2021
Other Open

Blogpost: De comeback van de KB-code

  • 1. Koninklijke Bibliotheek

Description

De comeback van de KB-code

5 juli 2016 Arno Kuipers

Oude trefwoorden gereanimeerd! Duizenden onderwerpsingangen in de KB-catalogus zijn opeens veel zichtbaarder geworden. Oude codes van de cataloguskaartjes van De Systematische Catalogus van de KB zijn vertaald naar Nederlandse woorden. De complete hiërarchie van dit classificatiesysteem is bovendien vertaald naar een nieuwe thesaurus. Niet alleen is de catalogus op deze manier verrijkt met betere ingangen, de ‘nieuwe oude trefwoorden’ kunnen ook hun diensten gaan bewijzen voor Delpher en andere digitale toepassingen.

 

Trefwoorden

Wie de laatste tijd wel eens wat heeft opgezocht in de KB-catalogus, heeft het waarschijnlijk al opgemerkt: er verschijnen opeens nieuwe lange reeksen met trefwoorden. Zo blijkt Eugène Mallets publicatie De l’essence des passions uit 1877 opeens te behoren tot de rubriek ‘Gevoelsleven en emoties’ en die rubriek blijkt gerangschikt onder ‘Afzonderlijke stromingen en onderwerpen’ van de Psychologie, die weer onderdeel is van de algemene categorie ‘Psychiatrie en psychologie’. Eugène Mallet deelt het setje ‘Gevoelsleven en emoties’ met 164 andere treffers, waaronder bijvoorbeeld de Philosophie du rire van Paul Scudo en De invloed van het gevoel op de redelijkheid van het denken van A.M. Benders. In een volstrekt andere categorie is nu duidelijk dat de bundel Reminiscences van Edith Kenyon uit 1935 hoort bij ‘Speciale vormen van maatschappelijke zorg’, namelijk die van lichamelijk gehandicapten. Ook als er meerdere talen in het geding zijn, is de uniformerende rol van deze nieuwe trefwoorden heel handig. Bij de rubriek ‘Ironie’ (onderdeel van ‘Levenshoudingen’) in de categorie Cultuurfilosofie zijn nu bijvoorbeeld zestien titels te vinden uit vijf verschillende talen.

Systematische catalogus

Deze nieuwe trefwoorden zijn eigenlijk helemaal niet nieuw, integendeel: sommige zijn al bijna een eeuw oud. De ‘nieuwe’ trefwoorden zijn namelijk de vertalingen naar gewone Nederlandse woorden van de beknopte codes die er eerst in hun eentje stonden, zoals ‘0050 dd’ of ‘298 madz’. Deze codes komen uit het oude systeem voor de onderwerpsontsluiting van de KB: De Systematische Catalogus van de Koninklijke Bibliotheek, in onze wandelgangen ook wel de KB-code genoemd. De codes stammen uit de tijd van vóór de digitalisering en het internet. De beknoptheid vindt daar dan ook mede haar oorsprong: de indelingen moesten op cataloguskaarten worden getypt die in lange lades werden ondergebracht. Een korte code als ‘50 eg’ vergt heel wat minder tijd en plaatsruimte dan een woordenreeks als Occulte wetenschappen – Parapsychologie - Hekserij -Moderne hekserij/satanisme (twintig treffers). Wie wel eens het KB-gebouw bezoekt, kan deze cataloguskaarten nog steeds bezichtigen, want de meterslange rijen kasten van de Systematische catalogus staan nog steeds in de algemene leeszaal (en worden ook nog steeds geraadpleegd!)

Soorten trefwoorden

Het werk aan de Systematische Catalogus werd in 1992 beëindigd. Toen stapte de KB voor de onderwerpsontsluiting over op de Nederlandse Basisclassificatie (link is external)en de Gemeenschappelijke Onderwerpsontsluiting(link is external) (Goo) . Deze worden sinds 2012 ook al niet meer toegepast door de KB, nog wel door andere bibliotheken. De KB beperkt zich nu tot het aanbrengen van de Depot-trefwoorden, in gebruik sinds de oprichting van het Depot van Nederlandse Publicaties in 1974. Ze worden ook wel Brinkman-trefwoorden genoemd, naar de grondlegger van de Nationale Bibliografie, Carel Brinkman.(link is external) In dit systeem leidt trefwoord Gedichten, oorspronkelijk Nederlands bijvoorbeeld naar Nederlandse dichtbundels. Maar het Brinkmantrefwoord stamt dus uit 1974 en de Goo uit ongeveer 1980, dus voor publicaties uit een verder verleden moest je altijd een beroep doen op de ‘oude’ KB-code. Dat betekende bijvoorbeeld dat ik mij als collectiespecialist de codes voor Nederlandse letterkunde moest aanleren. Daardoor weet ik dat 473 d betekent: Prozateksten uit de periode 1830-1880 binnen de rubriek Letterkundige teksten, binnen de rubriek Nederlandse taal- en letterkunde, oftewel: Nederlandse romans en verhalen uit 1830-1880

Vertaalslag

Gelukkig hoefde ik voor elke code niet telkens de kaartenbakken te raadplegen, want in principe was de KB-code beschikbaar als online instrument. Dat is te danken aan een aantal oude KB-rotten dat rond 1990 goed heeft opgelet. De oude systematische codes zijn toen meegenomen tijdens het overtypen van de kaarten (‘retro-catalogisering’) voor de toen nieuwe digitale online publiekscatalogus. Maar deze duistere code alleen was natuurlijk niet heel erg publieksvriendelijk. Je moest al behoorlijk goed zijn ingewijd in de oude KB-systemen om hier gebruik van te kunnen maken. Daarom is nu een enorme vertaalslag gemaakt door de oude codes te vertalen naar heldere Nederlands woorden.

Thesaurus

Ogenschijnlijk lijkt het vertalen van deze codes een eenvoudige klus, maar dat was het allesbehalve. De volledige hiërarchische boomstructuur van de KB-code moest namelijk worden overgezet. De hoofdrubriek bevat soms duizenden titels, het laagste soms maar enkele. En het is niet zo dat je bijvoorbeeld ermee kunt volstaan om de code voor ‘Proza’ uit 473 d eenvoudig te vertalen naar het woord ‘Proza’, want ‘Proza’ hangt onder verschillende takken van de classificatie. Engelse en Duitse letterkunde hebben zo bijvoorbeeld hun eigen Proza-rubrieken per tijdvak, die enkel zijn te herkennen aan de bovenliggende hoofdrubrieken. De dikkere takken van de boom, tot en met de stam, moeten dus steeds mee getoond worden omdat je anders extreem zou versimpelen. Daarom zijn alle codes omgezet naar een thesaurus(link is external). Deze nieuwe thesaurusstructuur biedt per rubriek steeds ingang tot sets van gelijkaardige titels. Dit was vooral zo’n ingewikkelde klus omdat van statische lijsten op papier een dynamische database moest worden gebouwd en in die statische lijsten natuurlijk heel veel typefouten en andere hobbels schuilden. Dat deze klus toch is geklaard, is te danken aan mijn uitmuntende collega’s Teunis van Lopik, Frank Peeters en vooral databasetovenaar Erik Vos.

P.C. Molhuysen

De KB-code of Systematische Catalogus is eigenlijk de nationale Nederlandse variant van de Library of Congres Classification(link is external) (LCC) uit Washington, maar hij is ook verwant aan Dewey’s Decimale Classificatie(link is external) (DDC) en de Universele Decimale Classificatie(link is external) (UDC) van de geniale Belg Paul Otlet(link is external). DDC uit 1876 is de oudste, LCC en UDC volgden rond 1900. Al deze systemen ontstonden in de tijd dat de bibliotheekwetenschap door de groeiende stroom aan publicaties en de stormachtig groeiende collecties nieuwe, efficiëntere ontsluitingssystemen met onderwerpsingangen moest uitdenken. Alleen een alfabetische catalogus op naam van auteurs was al lang niet meer voldoende. De KB-code maakt ook deel uit van deze beweging. De aanzetten tot een eigen Systematische Catalogus werden al gegeven door Willem Byvanck,(link is external) de Bibliothecaris van de KB in de jaren 1895-1921, maar hij kwam tot volledige wasdom in de tijd van Byvankcs opvolger Philipp Christiaan Molhuysen(link is external), Bibliothecaris van de KB van 1921 tot 1937.

 

Metadata zijn onmisbaar

De trefwoorden van de KB-code en de andere systemen zijn misschien oud, maar dat betekent niet dat ze overbodig zijn geworden. Voor mijn werk als collectiespecialist heb ik ze vrijwel dagelijks nodig. De meeste vragen die ik krijg van studenten en onderzoekers zijn alleen maar met dit soort metadata(link is external) te beantwoorden. Vragen als: hoeveel dichtbundels uit 1950 bezit de KB? Welke Nederlandse uitgeverij gaf essaybundels uit over Duitse poëzie? Hoeveel Nederlandse romans werden in 1980 vertaald naar het Frans? Enzovoorts. Voor dit soort vragen heb je nauwelijks iets aan auteursnamen en titels, maar zijn de trefwoorden, de genreaanduidingen en de taal- en landcodes onmisbaar. En daarom ook is het aanbrengen van metadata in het algemeen en van trefwoorden in het bijzonder zo’n kerntaak van bibliotheken. Dat is wat catalogiseerafdelingen doen: beschrijvingen en trefwoorden toekennen aan boeken om ze beter vindbaar te maken.

 

Wij wel, Google niet

Met dit soort classificatiesystemen en onderwerpsontsluitingen heeft de bibliotheek dan ook iets in handen wat Googlebooks bijvoorbeeld niet heeft. Er wordt wel eens gedacht dat de digitalisering dit soort oude catalogus-trefwoorden obsoleet zou maken. Zelfs in bibliotheekland hoor je wel eens zeggen dat als de boel gedigitaliseerd is ‘mensen het toch wel vinden’ en dat de oude cataloguskennis niet meer nodig is. In die redenering is digitalisering een oogoperatie en catalogus-metadata de blindenstok die weggegooid kan worden als de patiënt eenmaal kan zien. Het is echter eerder andersom. Ook in het gedigitaliseerde domein zijn categorieën nodig waarmee je meerdere publicaties uit een collectie kunt groeperen. Voor de groeiende zee aan gedigitaliseerd materiaal zijn eigenlijk alleen maar meer navigatiemiddelen nodig. Juist om die uitdijende en dieper wordende digitale zeeën te kunnen bevaren zijn boeien, vuurtorens, vaarroutes, radars, sleepnetten, hengels en loodsen nodig. Het gebrek aan goede metadata in Googlebooks wordt daarom ook al jaren betreurd, bijvoorbeeld door Laura Miller die in 2010 in een overzichtsartikel getiteld ‘The trouble with Googlebooks’(link is external) al stelde dat naast alle prijzenswaardige nieuwe mogelijkheden van de digitale wereld het nog steeds belangrijk is om de ‘oude’ metadata ook te blijven benutten: ‘In time, you could generate all kinds of interesting new classifications, too, but you have to have the old ones’ (cursivering van mij).

Nieuwe toepassingen

De ‘old ones’ van de KB-code zijn in ieder geval weer tot leven gewekt. Meer dan 1 miljoen titels uit onze catalogus dragen een KB-code en daarvan hebben meer dan 600.000 titels alléén deze vorm van onderwerpsontsluiting. En laten dit nou juist in veel gevallen de oudere titels zijn die door de KB worden gedigitaliseerd voor Delpher. De KB-code staat in principe dan ook al klaar in Delpher, maar daar moet de vertaalslag van cijfertjes naar woorden nog worden gemaakt om een goed zoekinstrument aan te kunnen bieden. Ook kunnen de nieuwe Thesaurus-sets die nu gecreëerd zijn van de oude Systematische Catalogus gereed worden gemaakt voor toepassingen op het terrein van Linked Data(link is external). Hopelijk kunnen we deze set spoedig gaan aanbieden naast de al voor Linked open data beschikbare thesauri. Er moet dus nog wel het een en ander gesleuteld worden, maar een bijna honderd jaar oud catalogussysteem is in principe gereed om nieuwe diensten te gaan bewijzen in het digitale tijdperk. De KB-code is terug!

Meer info

Systematische code in de Catalogus

 

Notes

Blogpost op KB.nl

Files

De comeback van de KB-code Blog Arno Kuipers.pdf

Files (451.2 kB)

Name Size Download all
md5:300e7b780abcfdae1129b455110dfa75
451.2 kB Preview Download