Wat heeft generatieve AI de ingenieur te bieden?

Het jaar 2023 stond in het teken van de doorbraak van AI-systemen die nieuwe teksten, beelden en codes kunnen genereren. Gaat generatieve AI ook helpen om wetenschappers en ingenieurs productiever te maken? En welke obstakels staan er in de weg? ‘Nieuwe ontwerpen moeten wel kloppen met de natuurwetenschappelijke realiteit.’

‘Sinds januari van 2023 versturen wij als bedrijf wel een paar voorstellen per week om uitdagingen van klanten op te lossen met generatieve AI’, zegt Joop Snijder, hoofd van het Research Center AI van IT-bedrijf Info Support.

Info Support is een bedrijf met zo’n 550 consultants en ingenieurs, onder wie zo’n dertig die zich bezighouden met AI. Snijder: ‘Eerst keken klanten de kat uit de boom om te zien of ChatGPT geen flauwekuldingetje was, maar toen het nuttig bleek, stroomden de aanvragen binnen.’

ChatGPT werd eind november van 2022 geïntroduceerd door het Amerikaanse bedrijf OpenAI en is sindsdien razendsnel het uithangbord geworden van generatieve AI.

Generatieve AI verschilt wezenlijk

Generatieve AI, kortweg GAI, is een vorm van AI die op basis van opdrachten (prompts) nieuwe teksten, afbeeldingen, video, audio en computercodes genereert. Daarin verschilt het wezenlijk van de voorspellende AI van de decennia daarvoor.

Voorspellende AI, zoals automatische beeldherkenning, ziet patronen in data en trekt daar conclusies uit – bijvoorbeeld: ‘op dit plaatje staat een auto die wacht voor een stoplicht’ – maar creëert niets nieuws met die data (zie kader Wat is generatieve AI?).

Kenniswerkers

In 2023 was er bijna geen economische of maatschappelijke sector die niet experimenteerde met GAI: van onderwijs tot zorg, van creatieve industrie tot financiële instellingen en van de juridische sector tot wetenschap en techniek.

In zijn vooruitblik op het jaar 2024 schreef Stanford-econoom Erik Brynjolfsson: ‘Ik verwacht dat massale toepassing door bedrijven zal leiden tot een aantal van de productiviteitsvoordelen waar we al lang op hopen. Kenniswerkers, mensen aan wie de computerrevolutie van de afgelopen dertig jaar goeddeels voorbij is gegaan, zullen hiervan gebruik gaan maken.’

Fruit

Het laaghangende GAI-fruit is vooral het creëren van teksten, het zoeken van informatie en het maken van samenvattingen. Maar wat heeft GAI wetenschap en techniek te bieden voorbij deze voor de hand liggende toepassingen? Kan GAI nieuwe technische ontwerpen maken, nieuwe geneesmiddelen bedenken, nieuwe materialen ontdekken en nieuwe software schrijven? En hoe zit het met de zorgen over betrouwbaarheid, transparantie, uitlegbaarheid, desinformatie, discriminatie en plagiaat van GAI?

Wat is generatieve AI?
Generatieve AI creëert op basis van tekstaanwijzingen nieuwe content zoals tekst, beeld, audio of programmeercode. Technisch gezien hoort GAI bij de groep van machinaal lerende systemen, en daarbinnen weer tot de subgroep diepe neurale netwerken.
Behalve tekstgenerator ChatGPT van het bedrijf OpenAI, en de vergelijkbare Bard en Gemini van Google, kent GAI ook bekende toepassingen als DALLE (ook van OpenAI) en Midjourney voor het genereren van beeld, Copilot van Microsoft, en open source toepassingen als het Franse Mistral en Llama 2 (van Meta in samenwerking met Microsoft).
Al deze toepassingen zijn gebaseerd op grote taalmodellen, modellen die voorspellen hoe een stukje invoertekst verder gaat. Grote taalmodellen hebben een groot aantal instelbare parameters (in de orde van miljarden), zijn getraind op enorm veel data (boeken, artikelen, code, websites, Wikipedia) en vergen veel rekenkracht.
Om nieuwe tekst te genereren, berekent het taalmodel de waarschijnlijkheid van vele mogelijke vervolgteksten. De meest waarschijnlijke vervolgtekst is vaak ook de saaiste. Hoe risicovoller de vervolgtekst, hoe creatiever, maar ook minder feitelijk betrouwbaar de tekst wordt. Welk stuk tekst het model kiest, hangt af van de modelinstellingen.
Hoewel de oorspronkelijke grote taalmodellen werden gebouwd voor tekst, kunnen ze net zo goed worden getraind op andere tekens dan gewone taal: beelden zijn immers om te zetten in pixelinformatie, audio in geluidsinformatie en programmeercode is op zichzelf al een op tekens gebaseerde taal. Deze eigenschap maakt GAI, in tegenstelling tot vroegere (voorspellende) AI, multimodaal.
Omdat de modellen zijn getraind op een breed spectrum van ongeordende en ongelabelde gegevens die ongefilterd van het internet zijn geschraapt en omdat ze multimodale taken kunnen uitvoeren, worden ze ook wel foundation models genoemd. Het idee is dat ze een algemene fundering vormen waarboven specifieke toepassingen kunnen worden gebouwd.

Tekst: Bennie Mols
Openingsbeeld: Een door AI gegenereerde afbeelding op basis van de prompt: 'een geautomatiseerd scheikundelab om nieuwe moleculen te ontwikkelen voor medicijnen met AI'. IIllustratie Shutterstock AI

Dit is niet het volledige artikel.