Na journalistiek en fictie is nu ook de wetenschappelijke literatuur niet meer veilig voor robots. Een algoritme schreef een boek over lithium-ion batterijen, waarin het kennis van drie jaar batterijonderzoek bundelde in een leesbaar, coherent manuscript. 

Het boek, zogenaamd geschreven door ‘Beta Writer’, geeft een samenvatting van ruim 53.000 artikelen over lithium-ionbatterijen. Een internationaal team van onderzoekers verzamelde de artikelen over batterijen aan de hand van steekwoorden en voerden ze in het algoritme. Daarna lieten ze de computer het werk doen: niks van het eindresultaat is nog verder aangepast, opgepoetst of gecorrigeerd. 

 

Zinnen omschrijven

De computer gebruikte de samenvattingen die aan het begin van veel wetenschappelijke artikelen staan om de essentie van een artikel te leren. Het keek naar de bibliografie om te kijken hoe artikelen naar elkaar verwezen. Het herkende bepaalde steekwoorden als belangrijk. En al die kennis gebruikte het programma vervolgens om een hoofdstukindeling te maken. Vervolgens vulde het de hoofdstukken in met passages uit de geanalyseerde artikelen. Het lukte de computer zelfs om synoniemen te gebruiken: de zinsnede (vertaald) ‘lithium-ionbatterijen hebben een grote rol gespeeld in elektrificatie van voertuigen sinds 2000’ werd in het boek ‘Sinds 2000 hebben lithium-ionbatterijen een hoofdrol gespeeld in de ontwikkeling van eletrificatie van voertuigen.’ 

Dat een programma zinnen omschrijft, is op zich niet nieuw. Maar wetenschappelijke literatuur is vaak moeilijker geschreven dan journalistieke stukken, en bevat veel jargon. Dat het algoritme toch om kon gaan met deze taal is dus een doorbraak, aldus de onderzoekers. 

 

Niet coherent

Dat betekent niet dat er geen verbeterpunten zijn. De makers van het algoritme noemen allerlei dingen: het ‘leest’ de tekst niet altijd correct, parafraseert lelijk of fout, is slecht in hoofdstuknamen bedenken en vormt soms incoherente paragrafen, waar zinnen slecht op elkaar aansluiten. Het zijn kinderziekten, die in het boek meer dan duidelijk zijn. Het is allemaal leesbaar, maar niet goed geschreven. 

 

Samenwerken met wetenschapper

Toch kan deze techniek een uitkomst bieden voor de wetenschap. De onderzoekers kozen niet voor niets batterijen als onderwerp: het is een tak van wetenschap waar nu ontzettend veel gebeurt. Het is moeilijk om de enorme stroom publicaties bij te houden. Een computer kan helpen om de kennis samen te vatten, zonder dat er duizenden kostbare manuren in gaan zitten. Dit betekent volgens de onderzoekers echter niet dat de mensen die nu wetenschappelijke boeken schrijven, straks werkloos thuis zitten. Een cooperatief model, waar mensen bijvoorbeeld de belangrijkste punten van jaren onderzoek opschrijven, en de computer de verwijzingen naar publicaties toevoegt, is ook een optie.

Beeld: Laura Fedrizzi