De overheid doet vaak veel te lang over het voldoen aan een Woo-verzoek van een burger of journalist om documenten. Dat komt doordat ambtenaren alle stukken met de hand moeten opsporen en verzamelen. Studenten van de TU Delft zetten kunstmatige intelligentie in om dit proces te versnellen.

 

Eerst even wat mogelijke verwarring wegnemen. Het opvragen van documenten van de overheid heette toch een Wob-verzoek? Het ‘Wobben’ van documenten is zelfs een werkwoord geworden, bekend onder journalisten, verwijzend naar de Wet Openbaarheid Bestuur.

Ja, dat klopt, maar die wet is in 2022 vervangen door de Wet Open Overheid (Woo) en sindsdien is er dus sprake van een ‘Woo-verzoek’ als een burger of journalist een beroep doet op zijn of haar recht om documenten en communicatie van overheidsinstanties in te zien.
 

Tijdrovend

Het probleem is dat een Woo-verzoek vaak erg tijdrovend is. Een ambtenaar moet handmatig op zoek naar documenten en beoordelen of de stukken wel relevant zijn voor de persoon die het Woo-verzoek heeft gedaan. Als eenmaal is besloten welke documenten worden aangeleverd, moeten daarin nog vertrouwelijke gegevens worden zwartgelakt, vaak de namen van betrokken personen.

Al met al is Nederland een van de landen waar het leveren van overheidsdocumenten het traagst gaat, zegt Max Muller. Hij was een paar jaar terug onderzoeksjournalist en deed, met een groep collega’s uit andere Europese landen, onderzoek naar oliewaterlozingen op zee. De Nederlandse overheid reageerde verreweg het traagste op verzoeken tot informatie. ‘Dat was een frustrerende ervaring.’

 

Ondraaglijk traag
Ministeries doen systematisch (veel) te lang over de beantwoording van Wob-verzoeken. Dat was de conclusie van het rapport ‘Ondraaglijk Traag’, dat in januari 2022 door de Open State Foundation en het Instituut voor Maatschappelijke Innovatie (IMI) werd gepubliceerd. Gemiddeld deden ministeries 161 dagen over het voldoen aan een Wob-verzoek, terwijl de wettelijke termijn voor de Wob (de oude versie van de Woo) toen 56 dagen was. Inmiddels is die termijn ingekort met ingang van de nieuwe Woo-wet (Wet Open Overheid) in 2022, de vervanger van de Wob (Wet Openbaar Bestuur). Aan deze Woo is een belangrijke clausule toegevoegd: de vertrouwelijke voorinzage. Die stelt journalisten en burgers in staat om de reeds verzamelde documenten te beoordelen op relevantie voor hun verzoek. Nu is de wettelijke termijn 42 dagen. Deze termijn wordt nog steeds systematisch overschreden.

 

Tijdlijnen

Muller besloot te gaan onderzoeken wat hieraan te doen is en inmiddels is hij duaal promovendus bij het Nationaal Archief en de Universiteit Utrecht. Binnen zijn promotieonderzoek doet hij onderzoek naar tijdlijnen, een van de manieren om structuur aan te brengen in grote hoeveelheden documenten.

Een tijdlijn geeft per definitie al structuur, doordat de verschillende documenten en gebeurtenissen (‘events’) bij een bepaalde datum zijn geplaatst. Muller: ‘Ik heb uitgebreid bekeken welke varianten van tijdlijnen er zijn. De vorm van de tijdlijn heeft invloed op het begrip. Tijdlijnen met een grafenstructuur kunnen grote hoeveelheden documenten en de onderliggende gebeurtenissen op een overzichtelijkere manier weergeven dan traditionele tijdlijnen. Mijn begeleiders van de Universiteit Utrecht en het Nationaal Archief en ik hebben die in onze wetenschappelijke publicatie ‘TimeFlows’ genoemd.’ Half mei presenteert Muller de publicatie op een congres in Portugal.
 

Doorploegen van grote aantallen documenten

Maar hoe maak je van een brei aan documenten en gebeurtenissen een mooie tijdlijn zonder dat ambtenaren daar weken mee bezig moeten zijn? Het antwoord is anno 2024, niet geheel verrassend: met AI. Een computerprogramma op basis van kunstmatige intelligentie (AI) heeft geen enkele moeite met het doorploegen van grote aantallen documenten.

Via i-Partnerschap – een netwerkorganisatie die de overheid en de academische wereld met elkaar verbindt – kwam Muller in aanraking met het studententeam Epoch van de TU Delft, dat zich heeft gespecialiseerd in kunstmatige intelligentie. Begin dit jaar won het nog een competitie waarbij op satellietbeelden zo goed mogelijk volautomatisch zeewier moest worden opgespoord, met meer dan zeshonderd deelnemers.

De leden van Team Epoch. Foto: Team Epoch

 

Onder begeleiding van promovendus Muller ging Team Epoch aan het werk met een bestaand algoritme voor het maken van een tijdlijn op basis van documenten. ‘Het team had maar acht weken de tijd om hieraan te werken. Ik heb daarom expres gekozen om een bestaand algoritme aan te dragen. Dat heeft er wel aan bijgedragen dat er nu een concreet resultaat ligt. Ik ben er erg over te spreken.’
 

Routeplanner

De studenten leverden een software-tool op die van een aantal pdf-bestanden automatisch een tijdlijn maakt: WOOgle Maps, met een knipoog naar de bekende online routeplanner. De beoogde gebruiker selecteert een aantal pdf-bestanden en uploadt ze. In de praktijk zal dit de ambtenaar zijn die de documenten voor de Woo-aanvraag verzamelt om ze inzichtelijk te maken tijdens verschillende stappen in het proces.
 

Nieuw onderdeel
Een belangrijk onderdeel daarvan is de vertrouwelijke voorinzage, nieuw sinds de invoering van de Woo. Die stelt een aanvrager in staat om de documenten in te zien die tot dan toe door de Woo-ambtenaren zijn beantwoord, en ze te beoordelen op de relevantie van het verzoek. Hoe meer documenten tijdens deze voorinzage eruit kunnen worden gefilterd, hoe kleiner het dossier is dat vervolgens dient te worden gelakt en voor goedkeuring langs een manager moet. Een kleinere selectie kan dit proces sneller doorlopen. Op deze manier kunnen tijdlijnen gegenereerd door WOOgle Maps tool de beantwoordingstermijn een stuk korter maken.

 

Voorbeeld van een tijdlijn. Klik op de figuur voor een vergrote weergave. Bron: Team Epoch


Documenten clusteren

Vervolgens gaat het algoritme achter de schermen aan het lezen, analyseren en structureren van de documenten. Het haalt uit de documenten de – meest waarschijnlijke – publicatiedatum, en het clustert de documenten die qua inhoud en publicatiedatum op elkaar lijken. ‘Die zullen wel iets met elkaar te maken hebben, is daarbij de aanname’, zegt Muller.
 

Tekstanalyse

Een belangrijke stap is het analyseren van de teksten ín de documenten. Deze tekstanalyse is een vertrouwde techniek in het vakgebied van de natural language processing (NLP), zegt Muller. ‘Hier rolt uit in hoeverre de teksten op elkaar lijken. Is dat het geval, dan staan ze op eenzelfde niveau op de tijdlijn die wordt gemaakt.’

Op die tijdlijn, die uiteindelijk op het scherm verschijnt, staan bij bepaalde data gebeurtenissen en de daarbij behorende documenten. In deze eerste fase zijn dat dus louter pdf-bestanden, maar in een toekomstig product zouden daar ook e-mails, whatsapp-berichten en officiële overheidsdocumenten bij kunnen komen.
 

Sloop van een woonwijk
Een tijdlijn is een verhaal, een narratief, over wat er allemaal is gebeurd, aan de hand van documenten en gebeurtenissen. Dat klinkt nog wat abstract en hoe WOOgle Maps precies werkt, laat zich dan ook het beste uitleggen aan de hand van een voorbeeld. Neem een gemeente die van plan is om een woonwijk te gaan slopen. Op de achteraf geconstrueerde tijdlijn kan dan onder meer terechtkomen:
- Het eerste voornemen van de gemeente tot sloop
- Brief met de bekendmaking van deze plannen
- Artikelen in de lokale krant
- Aankondiging van bijeenkomst van bezorgde burgers
- Bezwaarschriften van bezorgde burgers
- Beantwoording van de gemeente
- etc etc

 

Niet op Amerikaanse computerservers

Bij het bouwen van WOOgle Maps konden de studenten geen gebruik maken van commercieel verkrijgbare taalmodellen, zoals ChatGPT. ‘Het gaat hier om vertrouwelijke en soms gevoelige informatie’, zegt Muller. ‘Die informatie mag niet op de computerservers van een Amerikaans bedrijf terechtkomen. Om diezelfde reden mogen ambtenaren officieel ook ChatGPT niet gebruiken.’ Er is dus een Nederlands taalmodel gebruikt.
 

Gebruikerservaring moet beter

De WOOgle-maps-software werkt, maar is als product nog niet helemaal af. Het is nu al vrij eenvoudig door leken te gebruiken, zegt Muller. ‘Maar het moet nog verder worden ontwikkeld voordat het in de praktijk ingezet kan worden. Daarvoor zou de gebruikerservaring nog beter moeten. Het kan nog beter aansluiten bij waarop de burger of journalist zit te wachten. Daarnaast zou je willen dat de analyse nog meer verschillende elementen uit de teksten haalt. Documenten worden nu alleen gesorteerd op onderwerp en op datum, maar je wilt veel meer verschillende actoren uit de tekst halen. Eigenlijk is een Woo-aanvrager vaak benieuwd naar: wie deed wat wanneer?’

Op dit moment is nog niet bekend wie de WOOgle Maps-tool verder gaat afmaken. Wel is duidelijk dat er behoefte aan is. Er zijn namelijk behoorlijk wat ambtenaren zoet met het zoeken, selecteren en lakken van documenten voor Woo-verzoeken. Muller: ‘Het lakken van documenten wordt gezien als een beetje een rotklus. Het zou mooi zijn als deze tool een tijdbesparing kan opleveren voor de ambtenaren die dit werk doen.’
 

Publiek moet zich snel kunnen informeren

Uiteindelijk kunnen burgers en journalisten dan profiteren, doordat ze sneller documenten van de overheid kunnen inzien. ‘Het is belangrijk dat het brede publiek zich snel kan informeren. Soms is het nodig om politici ter verantwoording te roepen, en dan moet dat idealiter gebeuren voordat die persoon wat anders is gaan doen. Of het is zaak dat een organisatie snel lering trekt uit bepaalde misstanden, zoals de Toeslagenaffaire’, aldus Muller.

WOOgle Maps, of vergelijkbare software, kan trouwens op veel meer gebieden van nut zijn. Eigenlijk overal waar zoveel documenten aanwezig zijn, dat het bijna niet te doen is om daar handmatig ordening in aan te brengen. Denk aan parlementaire enquêtes, waar ambtenaren grote aantallen documenten, mailtjes en gebeurtenissen moeten verzamelen en ordenen.

‘Het kan in principe worden gebruikt in elke situatie waar je een hoop documenten hebt die je kan verdelen in meerdere tijdlijnen’, zegt Jeffrey Lim van Team Epoch. ‘Dat kunnen Woo-dossiers zijn, maar het kunnen ook nieuwsartikelen, papers, of boeken zijn. Onze tool kan dus ook interessant zijn voor journalisten en historici.’
 

Tool voor ingenieurs?

Zouden ingenieurs iets kunnen hebben aan de nieuwe tijdlijnen-tool? We zijn benieuwd naar jouw reactie. Laat het ons weten via redactie@ingenieur.nl.

 

Openingsbeeld: fictief voorbeeld van een officieel document met zwartgelakte zinsneden. Illustratie: Shutterstock / AI