Open-source software is vrij beschikbaar, ook voor data analytics. Met slechts een paar klikken download je de broncode en kun je gaan sleutelen aan data en analytics-modellen. “Je hoeft er niet voor te betalen, maar het is daarom niet gratis”, waarschuwt Tine Van Dyck, business value manager bij analytics-specialist SAS.
Voor analytics zijn tal van innovatieve open-source modellen en tools te vinden. Maar voordat je die effectief kunt inzetten, zijn er wel een aantal zaken waarmee je rekening moet houden. Dat begint al met het verzamelen en verwerken van de benodigde data. Vandaag is er geen vrij beschikbaar geïntegreerd open-source data-analytics platform dat standaardisatie, beheersbaarheid en samenwerking afdwingt. “Het risico is dan groot dat binnen een organisatie de verschillende gebruikers elk in hun eigen silo met hun eigen data en eigen modellen op hun eigen manier aan de slag gaan. Dit leidt na verloop van tijd onvermijdelijk tot inconsistenties en inefficiënties.”
De drempel om open-source modellen te gebruiken is laag, wat het voor data scientists erg interessant en toegankelijk maakt. Om de waarde van data-analytics modellen op een consistente manier te realiseren, moeten deze in de operationele en beslissingsprocessen worden opgenomen. Open-source modellen sluiten echter niet altijd aan op de bestaande (commerciële) software en systemen. Daardoor is vaak extra werk nodig, zoals het opnieuw coderen van modellen. Opschaling is eveneens een uitdaging door het gebrek aan ondersteuning van de hele data-analytics cyclus: van het verkennen van en experimenteren met data tot modelontwikkeling en -implementatie, inclusief validatie, testen, monitoring en hertraining. Zelf een data-analytics platform bouwen met open-source componenten kan, maar is geen aantrekkelijke optie. Door de sterke fragmentatie van het open-source landschap, met nieuwe versies op verschillende momenten, kunnen de implementatie- en beheerskosten behoorlijk oplopen.
Dit alles is voor Van Dyck echter geen reden om open source volledig af te wijzen. “Je kunt de voordelen van een geïntegreerd analytics-platform zoals SAS biedt, combineren met de open-source technologie die vandaag erg in trek is bij data scientists. Zo krijg je het beste van beide werelden, met de vrijheid om programmeertalen en analytische technieken te kiezen en die te gebruiken binnen een robuust analytics ecosysteem dat transparantie, beheersbaarheid en veiligheid garandeert.”
Met zo’n professioneel platform houd je de risico’s onder controle. “Het geeft consistente waarde en leidt tot versnelde innovaties, betere bedrijfsresultaten, beter gebruik van resources en lagere opportuniteitskosten. Wij hebben berekend dat je met een geïntegreerd platform voor data analytics je total cost of ownership met 25-30% kunt verlagen en je time-to-value met een factor twee tot drie kunt verkorten.”