Kunstmatige intelligentie (AI) is nu al een integraal onderdeel van ons dagelijks leven. Terwijl het tot nu toe een vrij eenvoudige vorm heeft aangenomen, is de situatie aan het veranderen. Dionysios Satikidis, Festo-expert over AI en Autonome Systemen, verklaart de verschillende leermethoden en hoe AI steeds beter wordt in het zelfstandig leren.
Kunstmatige intelligentie is in essentie een type software. Wat is het verschil met de software die we kennen van onze computer of uit de industriële automatisering?
Dionysios Satikidis: Neem bijvoorbeeld optische karakterherkenning. In conventionele software, die is gebaseerd op handmatige programmering, zou je het getal negen kunnen definiëren als een cirkel die verbonden is met een verticale lijn die er rechts onder staat. Onderscheidende kenmerken zijn opgeslagen in een programma voor optische tekenherkenning. Moeilijker wordt het, als iemand een negen anders schrijft dan de meeste mensen. Als ik wil dat een machine alle mogelijke varianten van een nummer herkent, moet ik een programma maken dat kan leren van handgeschreven gegevens. Dat wil zeggen kunstmatige intelligentie.
Van commando tot competentie – zou dit een nauwkeurige manier om de overgang van programmering naar AI te beschrijven?
Satikidis: Ja, absoluut. Het doel is om een machine te hebben die niet langer alleen maar commando’s opvolgt, maar zelfstandig leert. We verwijzen naar het leren van patronen en regelmatigheden in gegevens als machine learning. Dit is momenteel de meest voorkomende vorm van elementaire kunstmatige intelligentie. Echter, als ik wil dat een machine zelfstandig kenmerken leert van gegevens, moet ik die machine de mogelijkheid te geven om zijn vaardigheden te verbeteren zonder menselijke tussenkomst. We noemen dit deep learning. Het is aan de software zelf om de kenmerken voor het herkennen van een patroon te selecteren. We kunnen niet precies zeggen waarom AI een specifieke eigenschap selecteert. Dit proces is een beetje als een zwarte doos.
Duurt het proces van het verzamelen van data niet lang? Zijn er manieren om dat sneller te doen?
Satikidis: Om betrouwbare resultaten te kunnen leveren, heeft AI behoefte aan enorme hoeveelheden gegevens: tienduizend, honderdduizend, beter nog een miljoen datasets. In het geval van deep learning is dit een probleem, in het bijzonder een tijdsprobleem, aangezien deze data moeten worden voorbereid door een persoon. Met name in de machinebouw krijg je nooit genoeg gegevens om, terwijl de machines draaien relevante patronen voor AI te creëren. Er is echter een oplossing in de vorm van versterkend leren of reinforcement learning. De AI leert hiermee zelfstandig een strategie door middel van versterking en beloning. Met de virtuele simulatie van een groot aantal AI’s tegelijkertijd is het mogelijk om het leerproces te versnellen. Op deze manier kunnen duizenden scenario’s worden uitgewerkt, versterkt of afgewezen in cyberspace. Pas wanneer je herhaaldelijk virtuele tests uitvoert van de mogelijkheden, begin je echt de voordelen te zien van reinforcement learning.
Hoe werd reinforcement learning geïmplementeerd tijdens de ontwikkeling van de BionicSoftHand?
Satikidis: Bij de ontwikkeling van de BionicSoftHand werden we bij Festo geconfronteerd met de uitdaging van het verzamelen van een voldoende grote hoeveelheid gegevens binnen een redelijke termijn. Met de parallellisatie van versterkend leren konden we veel gegevens binnen korte tijd verkrijgen en de bionische hand was in staat om zichzelf te leren hoe je een 12-zijdige vorm -een dodecaëder – hanteert. Als we de BionicSoftHand op de conventionele manier hadden willen programmeren, dan zou dat een enorm project zijn en zouden we niet in staat zijn geweest om alle mogelijke varianten af te dekken.
In plaats daarvan hebben we een krachtige simulatie gemaakt in de vorm van een videospel, waarin de hand het object moet manipuleren. De AI krijgt de opdracht om de dodecaëder op een dusdanige manier te roteren dat een specifieke kant naar boven wijst. We vertellen de AI niet hoe dit te doen: die zoekt het zelf uit door vallen en opstaan.
Een centrale rol is er voor een random generator, die het de AI mogelijk maakt om veel verschillende scenario’s te doorlopen.