Ieder item in onze heeft een zgn classificatiecode. Deze code zegt iets over de inhoud van het boek, rapport, dissertatie etc. In de catalogus kan gezocht worden op deze codes zodat de collectie goed afzoekbaar is. In de blauwe boekenwand van de Centrale Bibliotheek zijn deze codes ook gebruikt om de boeken weg te zetten. Onze informatiespecialisten doen dit werk, ook wel onderwerpsontsluiting genoemd, handmatig. In de toekomst gaat dit veranderen. Een kijkje achter de blauwe wand…  

Tekst Zofia Brinkman, Arie Braat, Jorden Esser

TU Delft Library Classificatiesysteem

TU Delft Library heeft al heel lang een eigen systeem van onderwerpsontsluiting. Onze huidige drieletter classificatie is eind jaren 90 ingevoerd omdat er behoefte ontstond aan een plaatsingssystematiek, toen de open boekenwand in de nieuwbouw zich aandiende.  Een eigen systeem, omdat de bestaande classificatiesystemen, zoals  Library of Congress of Dewey, niet specifiek genoeg  waren voor het exact ontsluiten van onze technisch-wetenschappelijke collectie. Anno 2011 omvat de collectie niet alleen papieren documenten maar ook steeds meer digitale bronnen, waaronder ruim 30 000 e-books.

Het Project

Het toekennen van classificatiecodes aan nieuwe collectie-items was altijd een traditionele taak van onze informatiespecialisten. Met de komst van grote pakketten e-books (soms duizenden titels in één aankoop) is classificeren een zeer tijdrovende en daarom bijna onbeheersbare klus geworden. Tijd dus voor een nieuwe oplossing. Zo zijn we begonnen aan ons Project Automatisch Classificeren, een uniek project in de bibliotheekwereld.
Ten eerste hebben we ons afgevraagd of zo’n classificatiesysteem in deze tijd nog nut had. Ons antwoord was: “toch wel”. Vanwege de systematiek van onze boekenwand, vanwege selecteren van bronnen en nieuwe aanwinsten voor de Virtuele Kennis Centra (VKC’s), en vooral omdat het zoeken op classificatiecodes de meest exacte methode is en blijft voor inhoudelijk ontsluiten. Ook in onze zoekmachine Discover.

Zo zijn we begonnen aan een nieuw, uniek traject met het doel om in ieder geval alle e-books automatisch geclassificeerd te krijgen. En dat werd een echte zoektocht. We hebben eerst enkele scenario’s uitgetest voor automatische vertaling van o.a. Library of Congress codes  naar ons classificatiesysteem. Maar dat bleek helaas geen succes. Op het moment dat we toch wel wat twijfel kregen over een goede afloop van ons project, begon een nieuw idee op te borrelen: HANDMATIG een vertaaltabel  bouwen aan de hand van verzamelde trefwoorden uit recordbeschrijvingen en vervolgens AUTOMATISCH d.m.v. een programma de classificatiecodes aan bronnen toekennen. Deze aanpak bleek uitstekend te werken en op deze manier hebben we in de pilotfase al onze Springer e-books van classificatiecodes kunnen voorzien, ruim 10 000 titels!
In het vervolgproject is onze vertaallijst uitgegroeid tot ruim 25 000 termen, die inmiddels ook handmatig zijn vertaald. Nu hebben we onze gehele collectie boeken aangepakt: papier en digitaal. Want de methode werkt niet alleen voor e-books, het idee is alleen vanuit de e--collectie ontstaan. Op dit moment zijn ook meer dan 20 000  boeken geclassificeerd die nog geen classificatie hadden. En binnenkort zullen alle boektitels in de collectie opnieuw automatisch worden geclassificeerd. Dat wil zeggen alle boektitels waar “additional subject informatie” voor beschikbaar is. Eventuele classificatiefouten uit het verleden zijn dan in één slag gecorrigeerd en de collectie heeft dan een duidelijke, consistente ontsluiting.

De winst

Ons project, hoewel grotendeels onzichtbaar voor de klant, brengt een enorme verbetering voor de bibliotheek met zich mee, zeker voor onze interne processen. In de toekomst kan de boekcollectie ontsloten worden met minimale inzet van informatiespecialisten: een grote efficiency-slag. Daarnaast is de ontsluiting van bronnen consistent en daarmee hebben we een kwaliteitsslag gemaakt, die het bijvoorbeeld beter mogelijk maakt om goede inhoudelijke selecties aan onze klanten te presenteren. En last but not least : onze systematiek biedt mogelijkheden om nog breder te worden toegepast, bijvoorbeeld in Discover.
Kortom: een succes!