Onvoldoende bereidheid tot data-delen en gebrek aan systeemkennis remmen machine learning

0

Door snellere chips en de beschikbaarheid van steeds meer digitale data neemt de belangstelling voor machine learning rap toe. Grote softwarebedrijven als MathWorks en Microsoft spelen daar met hun producten op in. Gartner voorspelt dan ook een vlotte opkomst van deze vorm van AI (artificial intelligence). In sectoren als de automotive is die reeds gaande. In andere sectoren, als de machine- en apparatenbouw, wordt die echter vaak nog gefrustreerd, doordat klanten hun data niet willen delen. Ook speelt gebrek aan kennis van de systeemarchitectuur de machinebouw parten.

Een lopende klus bij Sioux LIME betreft het verbeteren van de functie van een pick & place-machine voor het verpakken van ijsjes. ‘Wij trainen het systeem, zodat het zelf de regels vindt’, vertelt Bas van der Linden. Foto: Com-magz

‘Machine learning kan zeer grote hoeveelheden data snel omzetten in zinvolle kennis en patronen’ Illustratie Josje van Koppen

‘Een lerend systeem is geen toverdoos’

  • ‘Machine learning ondersteunt de mens in het vellen van een oordeel.’
  • ‘Er zijn al systemen die beter zijn in herkennen van patronen dan de mens.’
  • ‘Met een intelligente regelaar kun je een robot of bewerkingsmachine beter laten functioneren.’
  • ‘Eerste vereiste: dat je beschikt over historische data.’

THEMA MACHINE LEARNING IN SNELLE OPMARS?

Houd een mens een foto van een poes voor, dan zal die dat huisdier gemakkelijk herkennen – thuis of op de basisschool bij biologie geleerd. Preciezer gesteld: hij heeft geleerd dat een specifieke combinatie van lijnenspel en kleurenpatroon een poes representeert. In zijn onderbewustzijn stelt de mens een set van vragen en aan de hand van de antwoorden daarop trekt hij een conclusie: als een lijn van ongeveer die positie naar ongeveer die positie loopt en op min of meer die plaats zit de kleur roze, et cetera, et cetera, dan betreft het een afbeelding van een poes. Dat we tot het zelf afleiden van regels in staat zijn, maakt ons intelligent.

Zelfstandig conclusies trekken

Nu is het mogelijk dit type van selectieprocessen te laten uitvoeren door een kunstmatig intelligent systeem dat de mens heeft gebouwd. Door het te voeden met bijvoorbeeld plaatjes van poezen en honden én daarbij aan te geven wat ze voorstellen, leert het AI-systeem de patronen erin te herkennen die kenmerkend zijn voor de poezenplaatjes. Dit kunstmatige systeem – een computer waarop een wiskundig model draait – maakt, net als de menselijke hersenen, gebruik van een neuraal netwerk. Waarbij de natuurlijke neuronen hebben plaatsgemaakt voor eenheden die eenvoudige berekeningen uitvoeren. Intelligent is het systeem omdat het uit een grote hoeveelheid waardes zelfstandig, dus ongeprogrammeerd, conclusies kan trekken.

De werking van die AI-systemen is inmiddels zo complex dat voor een mens niet meer te achterhalen valt waarom die computer een bepaalde beslissing neemt. Dat hoeft geen probleem te zijn als het gaat om zoiets als beeldherkenning voor marketingdoeleinden. Als de computer in negentig procent van de gevallen de poes van de hond weet te onderscheiden, is dat voor de doorsnee Google-adverteerder voldoende. Problematischer wordt het als dat systeem de kwaliteit van producten moet controleren: één procent foutieve oordelen leidt dan al gauw tot een onacceptabele hoeveelheid onterechte afkeur of goedkeur. Bedrijven als Sioux LIME in Eindhoven zetten zich dan ook in om AI, specifieker geduid als machine learning, toepasbaar te maken in industriële processen. Dat vergt dat de werking van die systemen beter wordt doorgrond, zodat ze tot 99,99 procent juiste conclusies komen.

Niet nieuw

Machine learning wordt inmiddels daar gebruikt waar het probleem te complex is voor vaste regels of vergelijkingen, waar de data steeds veranderen en waar het om het interpreteren van zeer grote hoeveelheden data gaat. Inmiddels zijn gangbare toepassingen te vinden in de luchtvaart (zoals engine health forecasting), het voorspellen van het weer en de aandelenmarkt, en het herkennen van stemmen en voertuigen. Het is dus geen nieuw fenomeen, beaamt Sioux LIME r&d-manager Bas van der Linden. Dat het nu alom zo in de belangstelling staat, heeft twee redenen. De gewone computerprocessor, de cpu, heeft heel veel tijd nodig omdat het slechts één neuron tegelijk kan doorrekenen. Sinds 2013 is de grafische kaart voor spelcomputers doorontwikkeld tot een betaalbare complexe gpu (graphics processing unit, red.) die aan een grote hoeveelheid neuronen parallel kan rekenen. De tweede reden is de ruime beschikbaarheid van digitale data. Door die toegenomen populariteit krijgt de Eindhovens ‘mathware’-onderneming steeds vaker vragen over machine learning-oplossingen, vertelt Van der Linden. Ter illustratie toont hij plaatjes van een aantal dwarsdoorsnedes van koperertssamples, afkomstig van een Chileens dagmijnbouwbedrijf. Dat wilde meer grip krijgen op de richting van hun delfwerk. Verondersteld werd dat het barstenpatroon in die samples daarvoor aanwijzingen kon geven. Mensen analyseerden dat patroon, maar dat was heel tijdrovend. ‘Wij hebben een systeem gebouwd dat samples beter en sneller kan beoordelen dan mensen.’

Jasper Wognum directeur BrainCreators

Snelle opkomst

Machine learning is het uitgesproken specialisme van het Amsterdamse BrainCreators, waarvan Jasper Wognum de directeur is. ‘Wij krijgen steeds meer vragen uit allerlei sectoren. Het eerste dat wij doen, is controleren of er data beschikbaar zijn éinCreatorsn of die voldoende gestructureerd zijn. Zo hebben we een klant die de homogeniteit van geproduceerd materiaal wil laten controleren. Niet meer steekproefsgewijs door een mens, maar door een intelligent camerasysteem. Hij beschikt over een grote hoeveelheid digitaal fotomateriaal waarvan een deel is gelabeld: in een deel van de data is aangegeven waar welke fout zit. Met al die data – pixels in feite – kunnen we ons wiskundig model voeden. Na een trainingsperiode herkent het model waar welk type fout zit en kan het betrouwbaarder worden dan de handmatige steekproeven. Dat scheelt vooral proceskosten, omdat je veel eerder en doelgerichter kunt ingrijpen.’

Wognum erkent dat de systemen die BrainCreators helpt ontwikkelen – ‘wij bouwen systemen, maar dragen onze kennis ook over aan de klant zodat die dat op termijn zelf kan doen’ – niet volkomen foutloos opereren. ‘Ze ondersteunen de mens in het vellen van een oordeel. Het systeem kan een tumor ontdekken en zelfs van welk type, maar de specialist is in moeilijke gevallen nog steeds nodig om vast te stellen of dat klopt.’ Tegelijk bestrijdt hij de stelling dat machine learning alleen geschikt is in niet-volledig geautomatiseerde processen waarin een klein percentage fouten geoorloofd is, omdat de mens als back-up fungeert. ‘Dat foutpercentage kan inmiddels heel klein zijn, afhankelijk van de kwaliteit en de omvang van de data waarmee je het systeem voedt. Er zijn al systemen die beter zijn in herkennen van patronen dan de mens.’ Hij gelooft dan ook in een snelle opkomst van machine learning in de industrie. En hij wordt daarin bijgestaan door Gartner. In een recente publicatie schrijft het onderzoeksbureau over het inzetten van machine learning in ontwikkelprocessen: ‘Het hanteren van de toenemende hoeveelheden gegevens die beschikbaar komen voor het ontwikkelen van nieuwe technische oplossingen, wordt spoedig onmogelijk. Machine learning biedt de mogelijkheid om die data snel om te zetten in zinvolle kennis en patronen.’

Theo de Vries van VIRO: ‘Een lerend systeem is geen toverdoos waarin zomaar al je technische problemen worden opgelost.’ Foto: VIRO

Systeembegrip vereist

Theo de Vries van internationaal ingenieursbureau VIRO ziet behoorlijk wat interesse in machine learning vanuit de machine- en apparatenbouw. Ook constateert de ‘kartrekker’ van het aandachtsgebied Smart Industrial Machinery binnen VIRO dat er in dat segment nog veel te winnen valt. ‘Met een intelligente regelaar kun je een robot of een bewerkingsmachine beter laten functioneren. Je kunt zorgen dat de bewegingen, voor snijden of lassen, optimaler worden uitgevoerd, of dat een kwaliteitscontrole nauwkeuriger verloopt. Maar dan moet je het probleem en de oplossing ervoor wel zelf eerst goed begrijpen. Dat systeembegrip is nodig om de juiste data te kunnen verzamelen; om daartoe op de juiste plaatsen in het proces de juiste metingen te doen. Zo kunnen met een intelligente regelaar de nadelige effecten van wrijving worden gecompenseerd. Die zijn lastig te voorspellen, maar ze zijn als ze zich voordoen wel goed te meten. Dat vergt wel dat je langere tijd, in tal van situaties en bij tal van snelheden de bewegingsafwijkingen meet. Zo bouw je een set statistieken op waarmee het intelligente systeem kan worden gevoed, correlaties kan berekenen en het juiste leerproces kan doorlopen, zodat het bij het besturen beter rekening kan houden met de wrijving.’

Verder vereist het ontwikkelen van een intelligent systeem dat de engineer ook de technologische principes van de rest van zijn machine goed doorgrondt: ‘Als een robotarm niet stijf genoeg is of als er speling ontstaat, is dat niet met intelligentie te compenseren. Het goed toepassen van machine learning vergt daarom inzicht in de complete systeemarchitectuur, kennis van alle mechatronische aspecten van het apparaat. Een lerend systeem is geen toverdoos waarin zomaar al je technische problemen worden opgelost’, aldus De Vries. Hij ziet wel steeds meer machinebouwers die die brede kennis van hun systemen hebben. Ook beschikken ze over een ruime hoeveelheid data. ‘De uitdaging is dan hoe je daar met intelligente software effectief gebruik van maakt. Daar kunnen wij hen goed bij helpen.’

Geen volledige datasets

Het vergaren van data blijkt voor een oemér van analyseapparatuur die anoniem wil blijven echter een knelpunt. Het bedrijf ontwikkelt al een aantal jaren aan een dataplatform voor de elektronenmicroscopen die het maakt. De senior projectmanager van de onderneming illustreert: ‘Voor een goede beeldkwaliteit is het heel belangrijk dat de elektronenbundel een rechte route aflegt. Tal van magnetische velden moeten daarvoor zorgen. Maar er zijn nog veel meer factoren van invloed op de mate waarin die bundel aligned is. Operators stellen nu op gevoel in en beoordelen aan de hand van het eindproduct – het analyseresultaat – in hoeverre ze de juiste instellingen hebben gevonden. Zou de machine zichzelf kunnen instellen om tot het beste resultaat te komen, dan zou dat veel tijd besparen. Maar dan moet de microscoop wel alle invloedfactoren kennen. Dat vraagt dat je ’m voedt met heel veel data over goede en slechte eindresultaten. Je moet allereerst in kwantitatieve termen duiden wat ‘goed’ en wat ‘slecht’ is. Vervolgens heb je heel veel, vele duizenden gekwantificeerde eindresultaten nodig. En dat moeten dan steeds complete datasets zijn, van het gehele analyseproces.’

Die data zeggen dan niet alleen iets over de kwaliteit van het analyseproces, maar ook iets over de kwaliteit van de wafer. Dus over het productieproces van de klant – en die data wil hij níet delen, uit concurrentieoverwegingen.

Voor het verkrijgen van grote aantallen datasets is de medewerking van meerdere klanten nodig en die blijkt niet eenvoudig te verkrijgen. ‘Stel een semiconklant gebruikt de ionenbundel van onze analysesystemen om een dwarsdoorsnede in een wafer te maken, om de kwaliteit ervan te onderzoeken. Die data zeggen dan niet alleen iets over de kwaliteit van het analyseproces, maar ook iets over de kwaliteit van de wafer. Dus over het productieproces van de klant – en die data wil hij níet delen, uit concurrentieoverwegingen. Als alternatief zou hij voor ons regelmatig een aantal neutrale dummy-processen kunnen draaien, maar dat kost ’m dure machinetijd, zonder dat wij daar meer tegenover kunnen zetten dan dat we mogelijk, op de lange termijn, een intelligente microscoop op de markt kunnen brengen.’ Door remote monitoring-contracten af te sluiten, die de oem’er de ruimte geven op afstand de werking van zijn installed base te volgen en zo predictief onderhoud te plegen, hoopt het bedrijf toch aan voldoende data te kunnen komen. ‘Met name onze commerciële klanten willen geen downtime en zijn bereid dergelijke contracten af te sluiten.’

Van wie zijn de data?

Ook Paul Pilotte, technical marketing manager, gespecialiseerd in data analytics en machine learning bij MathWorks, constateert dat de implementatie van machine learning in bepaalde sectoren wat minder hard loopt, juist vanwege het ontbreken van geschikte data. ‘De machines van kleine oem’ers bevatten tal van sensoren. Momenteel wordt met name domeinexpertise opgebouwd en gekeken hoe data meer beschikbaar gemaakt kunnen worden in big data-systemen van bedrijven. Daarbij komen ook aspecten kijken als dataprivacy. En soms is niet altijd duidelijk van wie de data zijn, van de eindgebruiker, de machinebouwer of diens leverancier van bijvoorbeeld het besturingssysteem. Ook vrezen sommige bedrijven voor het aantasten van hun verdienmodel: dat servicebedrijf dat nu veel geld verdient met gepland onderhoud, ziet niet direct brood in intelligente predictive maintenance die uitsluitend wordt uitgevoerd als het echt nodig is.’

Toch verwacht Pilotte, verwijzend naar Gartner, dat de markt voor machine learning de komende jaren snel gaat groeien. ‘Veel ceo’s van industriële bedrijven vragen zich af hoe zij hun bedrijf het beste kunnen digitaliseren, met machine learning als de stap erna. De kennis van data science is ook niet langer iets van alleen de academische onderzoekers: die vind je ook steeds meer terug onder de engineers binnen bedrijven. Een factor daarin is dat wij met onze MATLAB-software het ontwikkelen van een wiskundig model en het ordenen en labelen van data veel toegankelijker hebben gemaakt (zie kader). De machine learning-toepassing van deep learning, het onderscheiden van patronen in beelden, teksten of geluiden, groeit het snelst, bijvoorbeeld in de automotive, voor autonomous driving. MathWorks biedt manieren om deep learning-modellen te integreren in embedded hardware.’

Jeroen ter Heerdt, data & advanced analytics evangelist bij Microsoft Nederland

Vier stappen

Ook een softwaregigant als Microsoft kan het toepassen van machine learning met zijn producten en diensten een stevige impuls geven. Jeroen ter Heerdt, data & advanced analytics evangelist bij Microsoft Nederland, duidt wat nodig is voor het kunnen toepassen van machine learning in industriële processen in vier stappen: connecteren (het vergaren van data uit productiesystemen), opslaan, analyseren en visualiseren. ‘Dat is dus wel een eerste vereiste: dat je beschikt over historische data. Alleen met gegevens over de werking van het proces in het verleden kun je met machine learning een voorspelling doen van de toekomstige werking van dat proces. Dat vergaren en opslaan gebeurt steeds meer’, constateert Ter Heerdt. ‘Het opslaan is namelijk zo goedkoop geworden dat het niet meer loont om data weg te gooien.’ In die grote hoeveelheden data kunnen met machine learning patronen worden onderkend. ‘Soms patronen die je op voorhand niet had verwacht. Stel je verzamelt niet alleen data over procesduur en -temperatuur en vibraties in de installatie, maar ook over het moment van de dag. Dan zou zomaar kunnen blijken dat bijvoorbeeld steeds om 12.00 uur ’s middags de kwaliteit van het proces daalt.’ Informatie die natuurlijk pas waarde krijgt als je daarvan de oorzaak kunt analyseren en de resultaten inzichtelijk kan maken.

Voor het zetten van die vier stappen – het connecteren, opslaan, analyseren en visualiseren – is er Microsoft Azure, een cloud computing-platform voor bijvoorbeeld het bouwen van een complete machine learning-applicatie op maat. ‘Azure is in feite een verzameling software-legostenen om je eigen applicatie te bouwen waarmee die stappen gezet kunnen worden. De IoT-Suite is een bouwblok voor het regelen van het vergaren van data uit de machines in een proces, bijvoorbeeld via Siemens Mindsphere. Met Azure Machine Learning kunnen die data worden geanalyseerd en omgezet in een voorspelling die met Power BI kan worden gevisualiseerd. Verbanden – oorzaak en gevolg – kunnen inzichtelijk worden gemaakt in een helder rapport, zodat op basis daarvan de juiste beslissingen kunnen worden genomen’, duidt Ter Heerdt een aantal van de Azure-bouwblokken. ‘Het wordt inmiddels veel toegepast, in de industrie en daarbuiten.’

Niet er ‘even’ bij

Hoe dan ook, machine learning is sterk in ontwikkeling en kan er door de gemiddelde mkb-machinebouwer niet makkelijk ‘even’ bij gedaan worden. Om daarin voorop te lopen, moet een bedrijf samenwerken met kennisinstellingen en zelf in (academisch) onderzoek participeren, aldus Theo de Vries van VIRO. Niet voor niets werkt hij, behalve voor VIRO, ook één dag in de week als hoofddocent bij de groep Robotics and Mechatronics aan de Universiteit Twente. ‘Dit is typisch een terrein waarop je alleen bij kan blijven door mee te draaien in onderzoeksprojecten met universiteiten en hogescholen, door bijvoorbeeld studenten te laten werken aan de probleemstellingen waarmee je als bedrijf wordt geconfronteerd.’

 

Labelen van data

MathWorks brengt onder meer MATLAB op de markt, een softwareprogramma voor het ontwikkelen van algoritmes, het analyseren van data en het visualiseren van de uitkomsten. Het wordt ook gebruikt voor machine learning en deep learning. Dit omdat MATLAB het gemakkelijker maakt gelabelde data van uiteenlopende herkomst (sensoren in machines, maar ook businessdata), die over een lange periode in verschillende standaarden zijn verzameld, in goed gestructureerde databases onder te brengen. Vervolgens kan een machine learning-model daarmee aan de slag, om in de data – mede op grond van hun ‘aangehechte’ labels – patronen te ontdekken, aldus MathWorks’ Paul Pilotte. ‘En voor deep learning-toepassingen kan onze software ook voor niet-gelabelde, ‘ground truth’ data (als waar veronderstelde testdata, red.) een uitkomst bieden, omdat die de gebruiker in staat stelt aan een dataset een prioriteitsstructuur te geven zodat die alsnog gelabeld kan worden.’

 Servitization met machine learning

Link 1 2018

Jeroen ter Heerdt van Microsoft constateert dat machine learning, behalve voor het optimaliseren van het proces, ook steeds vaker wordt ingezet voor het optimaliseren van het product. ‘Door er een dienst van te maken of er een dienst aan toe te voegen. Zoals ThyssenKrupp, fabrikant van onder meer liften, dat doet. Die heeft zijn liften volgehangen met sensoren die data verzamelen over de intensiteit van het gebruik. Deze data zet het bedrijf om in een voorspelling van het onderhoud dat een bepaalde lift nodig heeft. Daardoor hoeft ThyssenKrupp nu viermaal minder onderhoud te doen. Onderhoud dat ze ook nog eens beter kunnen plannen en waarvoor ze minder reserveonderdelen op voorraad hoeven te houden. En de liftgebruiker staat minder vaak voor een gesloten deur.’

Publicatie uit Link 1 2018, meer informatie over machine learning

 

Share.

Reageer

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.

Geverifieerd door ExactMetrics