Computer herkent verschillende handschriften in document uit Oudheid
Van een ruim tweeduizend jaar oude tekst is met behulp van aan de Rijksuniversiteit Groningen ontwikkelde algoritmen komen vast te staan dat hij is geschreven door twee schriftgeleerden. Het gaat om een Dode Zeerol met tekst van de profeet Jesaja erop. Een doorbraak voor het onderzoek naar documenten uit de Oudheid.
Het bestuderen en analyseren van eeuwenoude handschriften was lange tijd een deels subjectieve bezigheid. Wie zich bezighoudt met het vakgebied van de paleografie bestudeert de vormen van de letters, de gebruikte inkt en het soort ondergrond. Die bevatten namelijk aanwijzingen over wie de auteur was van een document.
Bij deze zoektocht krijgt deze wetenschap nu de hulp van de computer. Onderzoekers in Groningen hebben computertechnieken ontwikkeld die van oude handschriften kunnen zeggen of die zijn neergepend door één schrijver of door meerdere makers.
Teksten van profeet Jesaja
De nieuwe techniek heeft zich nu bewezen met een grondige analyse van een van de Dode Zeerollen, een verzameling belangrijke religieuze teksten vervaardigd in de tweede eeuw voor Christus. Van deze rol met teksten van de profeet Jesaja blijkt nu dat hij is geschreven door twee verschillende mensen. Tot nu toe dachten de meeste paleografen dat hiervoor maar één auteur verantwoordelijk was. Het werk is vorige week gepubliceerd in het wetenschappelijke tijdschrift Plos ONE, en is gratis te lezen.
Tinten bruin
Stap één van de analyse was het digitaliseren van de rol, en die was al vóór het Groningse onderzoek gedaan, door middel van foto’s van zeer hoge resolutie. Daarop is ook direct een probleem te zien. ‘Deze Dode Zeerol is op schapenhuid geschreven. Dat veroorzaakt een donkerbruine kleur, waarbij de inkt slechts een fractie donkerder is. Elders op dezelfde pagina kunnen de tinten van achtergrond en inkt lichtbruin zijn, een lastig gegeven als je traditionele computer vision wil gebruiken’, vertelt Lambert Schomaker, hoogleraar informatica en kunstmatige intelligentie aan de Rijksuniversiteit Groningen.
'Zit daar inkt of niet?'
De uitdaging voor de computer is om hier toch chocola van te maken, oftewel om pixel voor pixel te besluiten of daar inkt zit of niet. ‘Wij willen alleen op basis van het schrijfspoor herkennen wie het heeft geschreven, en daarvoor geen extra hints uit de ondergrond gebruiken’, zegt Schomaker. ‘Als je de achtergrond niet verwijdert, dan zou het kunnen dat een visueel algoritme de textuur van de schaapshuid gebruikt om ‘schrijvers’ te classificeren, en dat wil je natuurlijk niet.’
Algoritme
Omdat het onderscheid in lichtintensiteit tussen ondergrond en inkt dus te klein is, moest het team het anders aanpakken. Promovendus Maruf Dhali ontwierp hiervoor een lerend algoritme, BiNet, dat eerst moesten worden getraind. Schomaker: ‘Een groep promovendi heeft in verschillende manuscripten handmatig gelabeld wat ondergrond is en wat inkt. Na een tijdje kan het algoritme dit dan zelf, door per pixel niet alleen naar intensiteit te kijken maar ook naar de visuele context. Daarna kun je de hele collectie betrouwbaar binariseren’.
Vormen, hoeken en kromtestralen
Nu er een digitaal bestand was van inkt en achtergrond – ruim 7 meter aan rol, 54 dichtbeschreven kolommen tekst – begon het eigenlijke onderzoekswerk. Het team liet op deze scans traditionele patroonherkenning los, software die vormen, hoeken en kromtestralen bepaalt. Al die parameters samen leveren een soort vingerafdruk op van de auteur van een tekst.
Vingerkootjes
Want iemand die schrijft is gebonden aan de wetten van de biomechanica, legt Schomaker uit. De grootte van iemands hand, de lengte van de vingerkootjes. ‘De keuze van de pengreep bepaalt welke bewegingen je gemakkelijk kunt maken bij het schrijven’.
Zo is er een relatie tussen de snelheid van de penpunt op het papier en de kromming van het schrijfspoor. Maakt de pen een scherpe bocht, dan heeft hij een lage snelheid, eigenlijk net als bij autorijden. Je kunt niet met hoge snelheid de bocht om.’ Die kromtestraal bepaalt de software door op elke inktpixel twee lijnen langs het schrijfspoor te leggen, die samen een soort scharnier vormen. ‘De kansverdeling van de combinaties van de twee hoeken blijkt specifiek te zijn voor iedere afzonderlijke schrijver.’
Scheiding halverwege het document
Toen promovendus Maruf Dhali de computer deze analyses liet uitvoeren, bleek dat er duidelijk een scheiding zat ongeveer halverwege het document. Hij vond duidelijk verschillen tussen het eerste en het tweede deel, in de vorm van de gebruikte karakters. Zonder veel uitleg gaven Dhali en de paleograaf Mladen Popović het probleem door aan Schomaker. ‘Ook door een geheel andere methode op de data los te laten ontdekte ik deze scheiding, dus we wisten: hier zit iets’, aldus Schomaker.
Kunstmatige vervormingen van de letters
Om het echt helemaal zeker te weten, deden Schomaker en zijn mensen nog een extra test. Elke letter werd een klein beetje, op een willekeurige manier, vervormd, een techniek die random morphing heet. ‘De tekst is dan nog wel leesbaar, maar je voegt wat kunstmatige ruis toe.’ Ook met deze kunstmatige vervormingen van de letters bleef in de analyse een verschil meetbaar tussen de letters in het eerste deel van het document en in het tweede deel. ‘Daarmee hadden we behoorlijk stevig aangetoond dat er een verschil in stijl zit tussen de twee delen. De verschillen waren telkens statistisch significant.’
Geesteswetenschappen
Nu was het tijd voor de informatici om de data over te dragen aan hun collega’s van geesteswetenschappen, ook in Groningen, onder leiding van hoogleraar Mladen Popović.
Paleografen dachten lange tijd dat deze Dode Zeerol was geschreven door één enkele schriftgeleerde, maar in die theorie kwamen nu scheurtjes. Schomaker: ‘Op basis van onze analyse zijn er twee scenario’s mogelijk. Ofwel zijn er twee mensen betrokken geweest, ofwel heeft die ene schriftgeleerde bijvoorbeeld iets aan zijn hand gekregen, een blessure, waardoor de tweede helft van de tekst er duidelijk anders uitziet, maar het oordeel daarover is aan de geesteswetenschappers.’
Heat maps
Als laatste voerden de onderzoekers nog een soort controle uit, om de resultaten inzichtelijk te maken voor de traditionele paleografen. Ze maakte van elke letter afzonderlijk een zogeheten ‘heat map’. Door alle ruim vijfduizend alefs (de eerste letter uit het Hebreeuwse alfabet) over elkaar heen te leggen, ontstond een gemiddelde van deze letter. Nu bleek de vorm in het eerste deel van de rol duidelijk af te wijken van de gemiddelde vorm van die letter in het tweede deel. Hier zag de computer dus iets wat zelfs de gespecialiseerde mensenogen hadden gemist.
Venster op het verre verleden
‘Dit is heel spannend, want het opent een nieuw venster op het verre verleden, dat zicht biedt op de complexe verbanden tussen de schrijvers die de boekrollen maakten’, zegt Popović in een persbericht van de RUG. ‘In dit onderzoek vonden we bewijs dat de twee schrijvers van de Jesaja Rol een vergelijkbare stijl gebruikten, wat erop wijst dat ze eenzelfde schrijfopleiding hebben gevolgd. Onze volgende stap is om andere boekrollen te analyseren en te zien of we daar misschien schrijvers met een andere opleiding vinden.’
Bedreiging
De paleografie heeft er nu dus een nieuwe, objectieve methode bij om extra informatie uit een oude tekst te halen. Daarover is echter niet iedereen in het vakgebied even opgetogen. Schomaker: ‘We hebben dit werk al gepresenteerd op een conferentie en niet elke paleograaf vindt dit leuk. Blijkbaar zien zij ons werk toch als een soort bedreiging, waardoor hun vak minder aanzien krijgt. Maar die angst lijkt me echt ongegrond. Zijn biologen soms gedaald in aanzien door de uitvinding van de microscoop?’
Openingsfoto: Fragment van de Jesaja-rol, die in totaal meer dan 7 meter beslaat en 54 dichtbeschreven kolommen tekst. Midden onder zijn drie ‘regels wit’ te zien waar de eerste schrijver stopte.
Afbeeldingen: Popović et al, Plos ONE, 2021.