‘Big data’ belooft veel: meten is weten is verbeteren. Maar voorlopig is het nog vooral een ‘big hype’ en vormen al die grote en gevarieerde databestanden vooral een ‘big mess’. MathWorks levert tools om met big data aan de slag te gaan en er zinvolle informatie voor engineering en de besturing van industriële processen uit te halen. Tijdens MATLAB EXPO 2016 Benelux kwamen concrete verhalen over de bühne. Van klimaatbeheersing in gebouwen tot opbrengststuring in productie.
MATLAB EXPO 2016
De big data stonden centraal tijdens MATLAB EXPO 2016 Benelux, die MathWorks eind juni organiseerde in Eindhoven. Zo ging de keynote van Sameer Prabhu, industry marketing director van MathWorks, over ‘The Rise of Engineering-Driven Analytics’. Katya Vladislavleva, ceo en chief data scientist van DataStories (Evolved Analytics) uit Turnhout (B), sprak over ‘From Data Science to Data Stories: Bridging the Gap to Digital Transformation’.
MathWorks is een vooraanstaand leverancier van tools voor data analytics en model-based design. Dat betreft MATLAB (voor algoritmeontwikkeling, data-analyse, visualisatie en numerieke berekeningen) en Simulink (modelgebaseerd ontwerpen en simuleren van multi-domein dynamische systemen). Kennisdeling en innovatie met MATLAB en Simulink staan centraal in de jaarlijkse MATLAB EXPO, gericht op onderzoekers en professionals uit industrie en onderwijs.
De verhalen van MathWorks en DataStories
Bij industriële big data gaat het niet alleen om de informatie die je uit simpele sensoren kunt halen, aldus Sameer Prabhu van MathWorks. Audio, real-time video, bewegingsdata, prestatiemetingen en businessdata kunnen allemaal zinvolle input leveren voor het analyseren van complexe verschijnselen. Maar dan moet je wel de middelen hebben voor die analyse. Over de jaren heen heeft MathWorks er tools voor ontwikkeld en toegevoegd aan zijn software voor numerieke wiskunde, inclusief statistiek, en modelvorming. Prabhu verwijst naar applicaties als DeepLearner en Classification Learner – voorbeelden van machine learning, een vakgebied binnen de kunstmatige intelligentie dat zich bezighoudt met de ontwikkeling van algoritmes en technieken waarmee computers kunnen leren. ‘Met die apps kunnen we de workflow voor het interpreteren van de data automatiseren. Gebruikers kunnen ermee van begrijpen (descriptive) naar voorspellen (predictive) naar ingrijpen (prescriptive) gaan.’ Cruciaal is dat de rekenkracht nu toereikend is om gigantische hoeveelheden data real time te bewerken, dankzij steeds snellere processoren en de capaciteit voor grootschalige dataopslag in bijvoorbeeld de cloud.
Sameer Prabhu (MathWorks): ‘Gebruikers gaan met big data van begrijpen naar voorspellen naar ingrijpen.’
De toepassingen kunnen heel divers zijn, laat Prabhu met enkele voorbeelden zien. Zoals een efficiëntere en comfortabelere klimaatbeheersing in gebouwen, gebruikmakend van weersvoorspellingen, energieprijzen en voorkeuren van bewoners. Of vrachtwagens automatisch laten remmen door een slim model dat gebruikmaakt van de informatie uit meerdere sensoren (radar en camera); dit als opmaat naar platooning (rijden in kolonnes). Of voorspelbaar onderhoud voor productiemachines aan de hand van de gegevens van tot wel honderd sensoren per machine.
Tekort aan data scientists
De opkomst van big data gaat zo snel dat er een ernstig tekort is aan data scientists, signaleert Sameer Prabhu. Idealiter beschikken zij over specifieke domeinkennis, om de uiteenlopende data te kunnen interpreteren. Daarnaast moeten ze natuurlijk kunnen programmeren en kennis van de benodigde statistiek en overige wiskunde hebben.
MathWorks onderkent het probleem en probeert daarom de opleiding van data scientists een boost te geven. Onder meer door z’n software beschikbaar te stellen aan het onderwijs, bijvoorbeeld met campuslicenties, en wedstrijden voor studenten te organiseren. Verder wijst Prabhu op de gratis toegankelijke mooc’s (massive open online courses) over allerlei datagerelateerde onderwerpen, die engineers en andere geïnteresseerden kunnen volgen als ze zich op big data willen storten. En domeinexperts zonder speciale programmeer- en statistiekervaring kunnen met hulp van de MathWorks-tools aan het werk. ‘Ze hoeven geen deskundige meer te zijn in neurale netwerken of andere machine learning-methodieken om met big data aan de slag te kunnen. Met hulp van onze tools kunnen ze gewoon verschillende analysemethoden en modellen toepassen. MATLAB maakt van iedereen een data scientist.’
Onbenut potentieel
Toch is er bij de analyse van grote en complexe databestanden nog wel een rol weggelegd voor specialisten. Dat stelt ceo Katya Vladislavleva van DataStories. De naam van haar bedrijf geeft het haarfijn aan: het gaat om het verhaal achter de big data. Voor het achterhalen van dat verhaal werkt het samen met MathWorks. Belangrijk, vindt directeur Marcel Stakenborg van MathWorks Benelux. ‘Wij zijn niet alleen een softwareleverancier, maar hebben ook een rol in het opleiden van de markt. Daarvoor werken wij samen met partijen als Datastories. Zij hebben toegang tot weer andere kanalen dan wij en kunnen de boodschap van big data met name naar het mkb vertalen.’
Marcel Stakenborg (MathWorks Benelux): ‘Wij zijn niet alleen een softwareleverancier, maar hebben ook een rol in het opleiden van de markt.’
Dat het belang van big data breed wordt onderkend, wil nog niet zeggen dat het potentieel ook al wordt benut, zegt Vladislavleva op grond van marktonderzoek van IDC uit 2014. Toen bleek dat negentig procent van het budget voor big data werd gebruikt om data te verzamelen. De volgende stap, het interpreteren van die data, kwam er nog bekaaid van af. Sterker nog, 95 procent van de verzamelde data werden helemaal niet gebruikt voor analyse. De situatie zal nu, twee jaar later, waarschijnlijk beter zijn, maar er blijft nog veel te winnen. Voorlopig is big data nog vooral een ‘big hype’ en zorgen al die uiteenlopende data die worden verzameld voor een ‘big mess’, aldus Vladislavleva.
Katya Vladislavleva (DataStories): ‘Onze aanpak levert een dashboard met focus op.’
DataStories streeft ernaar om met analyse te komen tot modellen die voorspellingen opleveren waarop actie kan worden ondernomen. ‘Als je iets kunt meten, kun je het begrijpen; als je het kunt begrijpen, kun je het veranderen’, parafraseert Vladislavleva de Amerikaanse schrijfster Katherine Neville. In de aanpak van DataStories begint het ‘verhaal’ bij een of meerdere kpi’s (key performance indicators) die de klant hanteert, bijvoorbeeld de opbrengst van een productieproces. De inzet van het verzamelen, analyseren en interpreteren van de data is om uit de brei van parameters (bijvoorbeeld uitlezingen van sensoren) het minimale aantal te vinden dat het verloop van die kpi’s voldoende goed voorspelt. Dat beperkte aantal parameters kan vervolgens in een dashboard worden ondergebracht voor de gebruiker, zoals een procesoperator. In een case van DataStories blijken vijf van de in totaal 1.200 parameters voldoende te zijn om het energieverbruik van een installatie te kunnen voorspellen. Dat maakt het voor de operator eenvoudiger om het proces te besturen dan wanneer hij voor een controlepaneel met tientallen of zelfs honderden metertjes zou zitten. In de woorden van Katya Vladislavleva: ‘Dit dashboard geeft focus.’