16 oktober 2019

Slimme robothand lost Rubiks kubus op

Twee neurale netwerken zijn er na uitgebreide training in geslaagd om met een oude robothand Rubiks kubus op te lossen. De robothand deed er in de meeste gevallen slechts enkele minuten over.

Het bijzondere is dat de netwerken zichzelf hebben getraind in eindeloze virtuele simulatiesessies, zonder ooit een kubus in handen te houden. Daarbij gebruikte OpenAI, de initiatiefnemer, een nieuwe methode: Automatic Domain Randomization (ADR). Die leert kunstmatig intelligente systemen om te reageren op situaties die ze tijdens de training niet zijn tegenkomen.

Complexe taak

De afgelopen decennia heeft robotica een deel van de fysieke taken, die eerder door mensen werden uitgevoerd, kunnen overnemen, in productielijnen bijvoorbeeld. Maar voor elke taak die mensen met de hand doen, moet steeds een specifieke robot worden ontwikkeld.

Het lukt nog niet goed om een robot te bouwen die allerlei verschillende taken kan uitvoeren. ´Het succesvol trainen van een robothand om een complexe taak uit te voeren, kan de basis vormen voor robots die voor een hele reeks doeleinden geschikt zijn', aldus OpenAI. De organisatie publiceerde haar bevindingen dinsdag.

Vijftien jaar oude robothand

Voor de kubusproef gebruikten de ontwikkelaars een vijftien jaar oude robothand. ´De hardware die we gebruiken is niet nieuw, maar de software wel´, aldus OpenAI in een persbericht. De organisatie werd een paar jaar geleden door Tesla-topman Elon Musk opgezet voor onderzoek naar kunstmatige intelligentie.

In mei 2017 begon OpenAI met het trainen van het neurale netwerk. Twee maanden later wist dat hoe het de kubus moest oplossen. Maar het zou nog meer dan twee jaar duren voor de robothand kon uitvoeren wat het netwerk wilde.

Onder een doek

Het lastigst, schrijven de makers, was om in de simulatie wisselende omstandigheden te creëren die zich ook in de echte wereld kunnen voordoen. Factoren als wrijving, elasticiteit en dynamica zijn lastig te meten en te modelleren. Om die reden ontwikkelde het team een nieuwe methode, ADR.

Die methode kan in simulaties steeds ingewikkeldere omstandigheden creëren. Zo wordt het systeem er steeds beter in daarmee om te gaan en kan het zich blijven focussen op de onderliggende opgave: het oplossen van de kubus. In dit geval lukte het de robothand uiteindelijk zelfs de kubus op te lossen als er een zwarte doek over de kubus was gelegd of als er tijdens het oplossen met een speelgoedgiraffe tegen de kubus aan werd getikt.

60 % score

Het oplossen van de kubus lukt echter nog lang niet in alle gevallen. Soms laat de robothand het ding vallen of komen de vlakken vast te zitten.

Als de kubus relatief simpel is op te lossen, met hooguit vijftien rotaties, dan lukt het de robothand in 60 % van de gevallen. Bij een ingewikkelde kubus (26 rotaties) lukt het slechts een op de vijf keer. 'Het is nog lastig een balans te vinden tussen het oplossen van de kubus en de fysieke handelingen die de hand moet uitvoeren', erkennen de ontwikkelaars.

Beeld: Open AI