Lees Ook

Big data? Start small.

Voor- en nadelen van big data voor bedrijven

Big data? Start small.
In de loop van de jaren genereert een bedrijf gegevens, veel gegevens. Over gegevens wordt vaak gezegd dat ze de nieuwe olie zijn, iets heel waardevols. En dus willen bedrijven uit hun gegevens waarde halen. Maar hoe beginnen we daaraan? Welke risico’s brengt het met zich mee? En is het voor elk bedrijf wel noodzakelijk om met data bezig te zijn? Data scientist Bert van der Zee legt uit wat het nut van data-analyse is en geeft tips voor wie ermee wil starten.
 
Op dit moment is er een serieuze evolutie aan de gang. Terwijl de afgelopen jaren druk met big data werd geëxperimenteerd, lijkt die experimenteerfase stilaan achter de rug. Bedrijven passen big data nu op de realiteit toe, met de bedoeling er resultaat uit te halen. De Nederlandse bank ABN Amro, bijvoorbeeld, zette onlangs het data science centrum stop waar ze een aantal jaren big data experimenten uitvoerden. In de plaats werd een nieuw datalab opgericht waar medewerkers bewuster met big data aan de slag gaan. Zo evolueert een bedrijf stilaan richting een datagedreven organisatie, een organisatie die heel veel met haar gegevens kan doen.
Bert van der Zee, data scientist en consultant bij Novalinq: “Een stapje verder is in feite artificiële intelligentie. Daarbij laat je bepaalde bedrijfsprocessen die op dit moment door mensen worden uitgevoerd, helemaal aan een machine over. Big data gaat over data-analyse, artificiële intelligentie gaat over automatische processen.”
 
Laat ons even terugkeren naar het begin. Big data beperkt zich niet tot de gegevens die we terugvinden in onze administratieve en financiële systemen, in onze webshop of in ons CRM-systeem (customer relationship management). Die traditionele, gestructureerde gegevens maken gemiddeld slechts 30% van alle data in een bedrijf uit, maar aangezien we er continu mee werken, kunnen we ervan uitgaan dat ze wel van goede kwaliteit zijn. Maar we spreken pas over big data als we ook gegevens uit bijvoorbeeld e-mails, vergaderverslagen, forums, sociale media, enz. meenemen. Punt is dat het gaat om een gigantische hoeveelheid aan gegevens die niet gestructureerd zijn en waarvan we niet precies weten wat ermee aan te vangen. En toch kunnen we uit die gegevens ontzettend veel informatie halen, al is die informatie indicatief en niet exact.
Bert van der Zee: “Stel, een modebedrijf brengt een nieuwe broek op de markt en na één maand blijkt uit de traditionele gegevens dat het er 10.000 van heeft verkocht. Dan zou je als bedrijf geneigd zijn voor de volgende maand opnieuw 10.000 stuks te produceren, want de verkoop verloopt goed. Uit informatie op een forum blijkt echter dat kopers ontevreden zijn over de broek: na twee wasbeurten verbleekt de kleur en ze scheurt gemakkelijk. Big data tonen hier dus aan dat de beleving helemaal niet positief is en het dus zinloos is om opnieuw 10.000 broeken te produceren. Als het je lukt om traditionele gegevens te combineren met big data, dan kun je een heel krachtig bedrijf worden.”

Nut van big data

Big data bestaat al langer dan vandaag. De Amerikaanse technologiereus Google legde zowat de basis ervoor. Google beschikte over heel wat zoekargumenten die het in de loop van de tijd had verzameld en wilde weten of het uitspraken kon doen door simpelweg te tellen hoeveel keer een bepaald zoekargument voorkwam. Daarvoor schakelde Google NgramViewer in.
B. van der Zee: “Heel wat boeken van de twintigste eeuw zijn gedigitaliseerd. Google NgramViewer gaat in die werken na welke woorden het meest voorkomen. Als ik bijvoorbeeld zoek op ‘oorlog’, dan valt op dat er twee piekperiodes zijn waarin die term meer voorkomt: de woordfrequentie ligt duidelijk hoger in de periode van de eerste en de tweede wereldoorlog.”
 
Google Trends doet iets vergelijkbaars, maar dan op basis van het eigenlijke zoekargument. Stel dat je wilt weten welke regio’s interesse hebben in kerstbomen, dan kun je ‘kerstboom’ als zoekterm ingeven en zoeken in bijvoorbeeld België. Uit de zoekresultaten blijkt dan niet alleen dat de belangstelling in kerstbomen sinds 2004 gestaag is gestegen, maar ook dat er zich jaarlijks een piek voordoet rond december, wat logisch is. Maar voor een kerstboomverkoper is het misschien interessant te zien dat er veel op ‘kerstboom’ wordt gezocht in Aalst, maar heel wat minder in Leuven.
B. van der Zee: “NgramViewer en Google Trends zijn heel eenvoudige systemen die de zoekfrequentie nagaan. Daar is niets ingewikkelds aan. En toch leveren ze al fijne resultaten.”
VC: In feite kan elk bedrijf met big data aan de slag gaan.
B. van der Zee: “In principe wel, maar in sommige bedrijfstakken zal big data gewoon niet zoveel opleveren. Je moet voldoende gegevens kunnen verzamelen om er conclusies uit te trekken. Ik kan me best voorstellen dat als je lampjes op de markt verkoopt, je weinig voordeel haalt uit big data. Je moet ook nagaan of big data wel bij je bedrijf past. Voor een webshop, bijvoorbeeld, kan big data heel nuttig zijn. Een webshop kan gemakkelijk analyseren welke producten veel worden gekocht en weet dat als consumenten het ene product kopen, ze vaak een bijhorend product aanschaffen. Maar het kost tijd en geld om die data te analyseren. We zien dan ook wel dat kmo’s zich minder op big data richten dan grotere bedrijven.”
 
VC: Maar op zich kan iedereen morgen aan een big data-oefening beginnen?
B. van der Zee: “Je moet je in de eerste plaats afvragen welk nut big data voor je bedrijf heeft en wat je wilt te weten komen. Maar elk bedrijf kan inderdaad met een klein testproject, een ‘trial’, beginnen. Je begint best met iets wat je zelf begrijpt, nadien kun je stap voor stap uitbreiden. Dat is wat we zonder al te grote investeringen bij Volkswagen hebben gedaan. Daar zijn we gestart met een trial van een tweetal maanden, waarbij we twee laptops met extra geheugen hebben uitgerust zodat ze datasets konden onderzoeken. Het enige doel was dat we na de trial aan de organisatie konden tonen wat je met big data kunt bereiken. Als volgende stap zijn we bij de productmanagers langsgegaan en hebben we hen gevraagd te bedenken wat we met big data zouden kunnen onderzoeken. Van die ideeën hebben we vervolgens een top tien gemaakt en de medewerkers van Volkswagen op twee projecten laten stemmen. Op die manier vergroot je ook constant de betrokkenheid van medewerkers.”
 
VC: Best wel belangrijk, want je hoort vaak dat bedrijven die met big data willen starten, moeite hebben om alle medewerkers mee te krijgen.
B. van der Zee: “Het is nochtans heel belangrijk, want medewerkers begrijpen de data van hun bedrijf. Een extern bedrijf kan dan wel allerhande ‘machine learning’ toepassingen doorvoeren, als het geen kennis over de interne data heeft, trekt het al snel de verkeerde conclusies. Ik geef een voorbeeld: toen de komeet Halley in 1986 rond de aarde draaide, stegen de brandstofprijzen. Statistisch gezien horen beide elementen bij elkaar, maar dat is natuurlijk toeval. Dat is het gevaar met data: het systeem kan verkeerde verbanden leggen. Het is dan dat medewerkers moeten ingrijpen.”
 
“Om big data succesvol in te zetten in je bedrijf, moet je ervoor zorgen dat je organisatie slimmer wordt. Daarom moeten medewerkers erbij worden betrokken en moeten ze worden opgeleid, zodat ze begrijpen waarover het gaat. Je begint met een klein groepje medewerkers, maar uiteindelijk zal iedereen binnen je bedrijf in aanraking komen met de gevolgen van big data-initiatieven. Er zullen dashboards komen met gegevens die medewerkers moeten kunnen interpreteren. Zorg er dus voor dat zoveel mogelijk medewerkers het project begrijpen, zodat de kennis zich als een olievlek in het bedrijf kan uitbreiden. Dan pas kun je vlot met big data werken.”
VC: We kunnen ons voorstellen dat het wel een tijdje duurt voordat de olievlek zich voldoende heeft verspreid.
B. van der Zee: “Je mag toch rekenen op een jaar tussen het prille begin en de eerste projectjes. Wil je een datagedreven organisatie worden, je werkprocessen op basis van data doen draaien, dan mag je daar nog een jaar bij optellen. Pas na een drietal jaar profiteer je echt van big data. Het duurt zo lang, omdat het impact heeft op de data die je wilt analyseren, de architectuur van de ideeën, de werkwijze van medewerkers en omdat het ingrijpt in je processen.”

Valkuilen van big data

Bert van der Zee werkt bij Novalinq, een Nederlands bedrijf dat advies geeft over de implementatie van big data en die implementatie ook begeleidt. Daarnaast geeft Novalinq opleidingen in big data en artificiële intelligentie aan hogescholen en bedrijven. De opleidingen worden op de markt aangeboden door bedrijven zoals Bit-by-bit, een Belgische opleider uit Antwerpen en de Passionned Group, een consultancybedrijf en implementatiepartner inzake business intelligence en analytics.
 
Bij Staatsbosbeheer, de Nederlandse overheidsorganisatie die alle gronden en recreatiegebieden bijhoudt en bossen en de houtkap beheert, zette Novalinq een trial op. “We hebben gekeken naar de aanwezige data”, specifieert Bert van der Zee. “Blijkbaar hield Staatsbosheer al dertig jaar lang enquêtes bij over de beleving van recreatiegebieden. De eenvoudige vraag die we wilden beantwoord zien, was hoe de beleving in de loop van de jaren is veranderd. Veel investeringen vroeg die trial niet.”
 
VC: Maar je moet het wel nog binnen je bedrijf weten te verkopen.
B. van der Zee: “Klopt, het is niet gemakkelijk om een goede business case op te starten. Daarom hamer ik er ook op dat je begint met kleine trials die realistisch zijn. Big data leent zich niet voor een project. Bij een project ken je het einddoel: je wilt bijvoorbeeld een applicatie bouwen. Het doel is gekend en dan moet je er enkel nog voor zorgen dat je de juiste stappen zet om tijdig het einddoel te bereiken. Als je een big data-initiatief opzet, weet je op voorhand niet wat het resultaat zal zijn en of het überhaupt iets zal opleveren. Je moet het meer als een ontdekkingsreis zien: je ontdekt gedurende de rit welke mogelijkheden er bestaan.”
 
VC: Is het te groots willen aanpakken de reden voor het lage aantal succesvolle big data-initiatieven?
B. van der Zee: “Het heet dan wel big data, je begint beter klein. Je moet bewuste keuzes maken. Realistische ideeën zullen stelselmatig tot kleine verbeteringen leiden. Bedrijven zoals Apple en Google hebben ook jaren testjes uitgevoerd voordat ze succes boekten. Geduld en tijd staan centraal. Je moet er bovendien rekening mee houden dat je met mensen werkt en zij moeten uiteindelijk willen samenwerken met de machines. Die samenwerking kan dan tot een slimmere organisatie leiden.”

Succesverhalen

De Nederlandse organisatie ‘Stichting Hulphond’ leidt honden op om mensen met een beperking te begeleiden. Maar van de honderd honden die de organisatie aankocht, slaagden er slechts weinig voor de opleiding. Via big data onderzocht de organisatie hoe dat kwam en hoe het inkoopbeleid kon worden verbeterd.
B. van der Zee: “We hebben de gegevens van hun database samen met de e-mails die ze hadden, geanalyseerd. Daaruit bleek dat het hondenras en de grootte van het nest de slaagkans voor de opleiding beïnvloedden. De labrador en labradoodle bleken helemaal niet zo succesvol, terwijl ze wel vaak werden aangekocht. Op basis van die resultaten hebben we een poster gemaakt waarop medewerkers zich voor hun inkoopbeleid kunnen baseren. Veel data hadden ze niet, maar ze hadden er voldoende om enorme verbeteringen te kunnen doorvoeren.”
 
VC: En bij volwassen organisaties zijn de succesverhalen legio, vermoeden we.
B. van der Zee: “Inderdaad. Zo is er een bedrijf dat de treinsporen in Nederland controleert. Er treden echter vaak storingen op doordat wissels vast komen te zitten en daardoor loopt het treinverkeer vertraging op. Via big data hebben we in model kunnen gieten wanneer wissels vast komen te zitten en uitgezocht hoe dat komt. Blijkbaar beïnvloeden de temperatuur, het stroomverbruik en het aantal keren dat een trein over de wissels rijdt, de kans op storingen. Nu kunnen we met 70% precisie voorspellen of een wissel binnen de drie dagen zal vastlopen. Afhankelijk van hoe hoog de kans op storingen is, wordt de route van de onderhoudsploeg aangepast. De onderhoudsploeg herstelt dus eerst de wissels die het meeste kans op storingen hebben en daardoor is het aantal storingen aanzienlijk afgenomen.”
 
“De Nederlandse Rabobank en bedrijfsrevisor Deloitte gaan nog een stap verder. Hun medewerkers moesten vaak een 30.000-tal documenten doornemen op zoek naar specifieke informatie. Nu is dat aantal herleid naar 300 documenten, waardoor medewerkers sneller kunnen zoeken. Daarvoor hebben Rabobank en Deloitte artificiële intelligentie ingezet. Woorden die vaak voorkomen, worden daarbij gegroepeerd en tot kernonderwerpen herleid. Dat is een mooi voorbeeld van de wisselwerking tussen mens en machine: medewerkers kunnen gerichter zoeken en sneller werken dankzij de ingrepen van de machine.”
 
VC: Woorden groeperen, zinnen tot kernbegrippen herleiden,… dat is allemaal nog gemakkelijk te volgen. Maar de mening van je consument achterhalen, bijvoorbeeld op basis van informatie op sociale media, is een ander paar mouwen.
B. van der Zee: “Stel dat je wilt weten wat de consument van pepernoten denkt. Dan doorzoekt je systeem de sociale media op het woord ‘pepernoten’. In dezelfde regel zoek je dan op het woord ‘lekker’. Je kunt ook peilen naar het woord ‘niet’, want misschien vindt een consument pepernoten niet lekker. Je gaat er telkens van uit dat die woorden, ‘lekker’ en ‘niet’, te maken hebben met pepernoten. Er zitten veel aannames in, waardoor het fout zou kunnen lopen. Maar met big data ga je ervan uit dat je voldoende data analyseert, zodat mogelijke fouten worden gecorrigeerd.”

Ethisch aspect

Sinds 25 mei 2018 is de GDPR (General Data Protection Regulation), een beschermingswet op persoonsgegevens, in de Europese Unie in voege. Daardoor mogen bedrijven niet zomaar alle persoonsgegevens van consumenten verzamelen of bewaren. Consumenten kunnen zelfs vragen om gegevens die vroeger zijn doorgegeven te verwijderen. “Wat technisch mogelijk is, strookt niet altijd met wat ethisch is verantwoord”, stelt Bert van der Zee. “Je moet er rekening mee houden dat het om mensen gaat. De wetgeving over data moet nog matuurder worden. Kijk maar naar de verkeersregels: toen de eerste auto’s op het toneel verschenen, waren er weinig verkeersregels. Met de grote hoeveelheid aan auto’s en de hogere snelheid gelden er duidelijke regels voor het verkeer.”
 
VC: Heeft het feit dat bedrijven minder data mogen bijhouden een weerslag op het succes van big data?
B. van der Zee: “Het voordeel van big data is dat het niet op individuen, maar op grote groepen mensen is gestoeld. Als medewerkers gemiddeld op 65-jarige leeftijd op pensioen gaan, wil dat niet zeggen dat jij dan op pensioen gaat. Big data hoeft ook niet te weten of jij het nu bent die aan 65 stopt met werken. Zolang het maar weet dat 65 de gemiddelde pensioenleeftijd is. Als je naar een bepaalde serie op Netflix kijkt, zal Netflix jou achteraf een serie voorstellen die erop lijkt of waar andere kijkers – die dezelfde serie als jij bekeken – interesse voor toonden. Je bent onderdeel van een groep. Big data wil eerder trends en groepen kunnen onderscheiden.”
 
VC: Is het toepassingsgebied van big data gerelateerd aan bedrijfsafdelingen?
B. van der Zee: “Zeker. Het mag dan wel de marketing van bedrijven zijn die er snel mee te werk is gegaan, ook de medische wereld was er als de kippen bij. En intussen zijn de financiële afdelingen hun schade aan het inhalen. Binnen forecasting wordt big data eveneens toegepast. Ook al weet je vaak wat de resultaten zijn: data maakt je veronderstellingen hard. Door simpel rechttoe rechtaan te redeneren, weet je dat kerstbomen meer in trek zijn net voor de kerstperiode, maar data maken die redenering ook nog eens objectief.”

www.passionned.be
 Onderwerp: Digital Business   Bedrijven: Credon 
Lees Ook
X