Kan een algoritme net zo goed boeken lezen als een ervaren recensent? NBD Biblion, de organisatie die boeken selecteert, recenseert en beschrijft voor bibliotheken, denkt van wel en zette zijn medewerkers aan de dijk. Dat leidde tot een golf van kritiek.

 

Tussen het verschijnen van een boek en het moment dat het bij de bieb in de kast staat, zit zo’n zes weken. De meeste tijd daarvan gaat op aan het produceren van ‘metadata’. Dat zijn gegevens zoals auteur en publicatiedatum, een korte omschrijving van de inhoud van het boek en informatie over de schrijfstijl. Tot nu toe was het opstellen van die data mensenwerk, maar NBD Biblion stelt dat kunstmatige intelligentie het net zo goed kan doen. Het voordeel? Vier weken tijdwinst en het is vast ook goedkoper.

 

Machine learning

Bookarang, een dochteronderneming van NBD Biblion, ontwikkelde het systeem dat de metadata voortaan produceert. Dat is gebaseerd op machine learning: het herkent patronen in de boektekst en zet deze om in de gevraagde informatie. Daarnaast bevat het enkele toegevoegde algoritmen, zoals statistische en grammaticale analyses.

Om het machine learning systeem te trainen werden vijftigduizend boeken ingevoerd waarvan al metadata bestonden – waaronder de metadata die de recensenten van NBD Biblion de afgelopen decennia aanleverden. Daarna kon het systeem zelf patronen in aangeboden teksten vinden en de gewenste metadata produceren. In ruim tachtig procent van de gevallen hoeft aan de automatisch gegenereerde metadata niets meer te worden gewijzigd, laat NBD Biblion weten. Wel wordt de korte tekst die beschrijft waarover het boek gaat achteraf door een menselijke redactie gecheckt en eventueel aangevuld.

Recensies maakt het systeem niet, vertelt Victor Bergen Henegouwen, business developer bij Bookarang in een webinar van NBD Biblion. ‘Die schrijven mensen vanuit een persoonlijke beleving, op grond van hun achtergrondkennis. Dat kan een algoritme niet. Die ambitie en pretentie hebben we dan ook niet.’  

 

Tijdsbeeld

Naast de tijdwinst heeft het nieuwe systeem meer voordelen, mailt Niels Bogaards, expert kunstmatige intelligentie bij Bookarang. Zo zijn algoritmen objectiever dan mensen, en kunnen ze opnieuw worden gebruikt als de metadatering moet worden aangepast aan een veranderd tijdsbeeld. Bogaards: ’Tegenwoordig wil men bijvoorbeeld vaak weten hoe ‘divers' een boek is. Daar is eerder minder op gelet. Door een algoritme toe te voegen of aan te passen kan zo'n analyse retrospectief op reeds gemetadateerde boeken worden toegepast.’

Een nadeel is dat sommige stijlvormen, zoals ironie, lastig automatisch te detecteren zijn. En er zijn de 'zeldzame gevallen' waar niet of nauwelijks mee getraind is. Bogaards: ‘Zo zijn er boeken geschreven uit het perspectief van een hond, wat een zeer eigenaardig en zeldzaam beeld oplevert. Dat soort dingen gaan nog niet goed.’

 

Ziedend

Volgens de recensenten en auteurs van de boeken gaat er wel meer niet goed. Zo herkent Ronald Giphart zijn eigen roman niet terug in de omschrijving van het algoritme en schreef (voormalig) NBD-recensent Anna Ros een ziedend stuk op het literaire weblog TZUM. Ros: ‘Boeken, non-fictie, fictie en literatuur lenen zich niet voor aanbevelingen op basis van door kunstmatige intelligentie in elkaar gerommelde informatie. Boeken vergen een serieuze benadering, voorzichtig en scherp, zakelijk en emotioneel, concreet en subjectief. Juist ook subjectief, want objectiviteit is een onmogelijk streven als het om de meeste boeken en zeker de literatuur gaat.’

 

Dit artikel verscheen eerder in het aprilnummer van De Ingenieur.

 

Openingsbeeld: Depositphotos