Twee jaar geleden werd ik uitgenodigd bij een startup van 300 miljoen dollar om hen te adviseren bij het kiezen van de juiste "big data technologie". We slaagden erin de juiste technologie te vinden voor hun "uitgesproken" behoeften. Echter, alle cellen in mijn lichaam wilden de VP van Analytics vertellen dat hun gerichte vragen mij deden denken aan het verhaal van de dronken man onder de lantaarnpaal [1]:
Een politieagent ziet een dronken man onder een straatlantaarn naar iets zoeken en vraagt wat de dronkaard kwijt is. Hij zegt dat hij zijn sleutels kwijt is en samen kijken ze onder de straatlantaarn. Na een paar minuten vraagt de agent of hij zeker weet dat hij ze hier verloren heeft, en de dronkaard antwoordt, nee, dat hij ze in het park verloren heeft. De agent vraagt waarom hij hier zoekt, en de dronkaard antwoordt: "hier is het licht".
Het straatlantaarneffect is een veel voorkomende ziekte van business analytics. Managers zijn dronken van alle buzz over big data en analytics. Ze hebben de gegevens (het licht!), en ze hebben iemand nodig om hen te helpen de sleutels tot waardecreatie te vinden. Daarom nemen ze data scientists in dienst om die gegevens om te zetten in inzichten. Maar dat betekent niet dat data scientists in staat zullen zijn om de "sleutels" tot waardecreatie te vinden. De sleutels kunnen ergens anders liggen...
Ik beschreef het probleem en adviseerde de VP een "Action Research" om "een strategie voor analytics te ontwikkelen". Dat zou hen helpen om de business vragen te prioriteren en te focussen op die vragen die de hoogste waarde (ROI) zouden kunnen creëren. De VP van Analytics wees mijn punt beleefd van de hand en zei dat ze dergelijke vragen al kennen. Vandaag hoorde ik echter dat de inkomsten van het bedrijf aanzienlijk zijn gedaald en dat veel werknemers zijn ontslagen. Het leek twee jaar geleden te voorzien, aangezien analytics de kern van hun bedrijfsmodel vormde.
Het stellen van de juiste vraag is de basis van een succesvolle business analytics. Volgens Jeremy Howard betekent het stellen van de juiste vraag dat je a) de juiste doelstelling moet identificeren, en b) de juiste hefboom moet kiezen. Howard, een van de bekendste data scientists van onze tijd zei [2]:
Het belangrijkste is om te kijken naar de vraag die je probeert te beantwoorden. En die splits ik in twee delen. Het eerste is de doelstelling die je probeert te bereiken. Bijvoorbeeld, verzekeringen zijn gericht op de doelstelling van het maximaliseren van de winst van elke klant. Het tweede waar we naar kijken is wat ik de hefbomen noem. Wat zijn de dingen die ik kan veranderen om de business te beïnvloeden? En in verzekeringen, is een van de belangrijkste veruit de prijs die u bepaalt. Met dit in gedachten, het maximaliseren van de winst door het veranderen van de prijs, kan ik nu gaan en zeggen wat voor soort model ik nodig heb om te bouwen die zou haak die twee stukken [prijs en winst].
Juiste doelstellingen bron in bedrijfsstrategieën. Wil het bedrijf de omzet en het marktaandeel vergroten? of streeft het naar een hogere winst? Streeft het naar de ontwikkeling van een merk of een nieuw product? Of wil het de kosten per klant of de kosten per product verlagen? Sommigen willen misschien eerder het risico verminderen dan de waarde verhogen. Kortom, de doelstelling moet in overeenstemming zijn met de bedrijfsstrategie.
Het vinden van de juiste hefboom kan een grotere uitdaging zijn. Een data science-team dat bijvoorbeeld wordt gevraagd een manier te vinden om de verkoop van een e-business te verhogen, kan zich richten op een van de volgende vragen:
- Wat is de concurrerende prijs voor elk product?
- Welke producten worden vaak samen gekocht?
- Waarom heeft de klant, die de details van verschillende producten heeft gelezen, de aankoop niet gedaan?
- Waarom komen onze klanten zelden terug voor een tweede aankoop?
- Waarom kopen huidige klanten wel bij ons, maar niet bij onze concurrenten?
- Hoe kan een aankoop "leuk" worden?
Het is duidelijk dat elk bedrijf geconfronteerd wordt met een lijst van vragen die beantwoord moeten worden. Deze vragen moeten worden geprioriteerd op basis van hun ROI, d.w.z. de waarde die zij kunnen creëren in tegenstelling tot de kosten van de vereiste technologieën, vaardigheden, datasets, enz. Dit is waar het complex wordt, want er zijn maar weinig mensen die in staat zijn om deze prioritering uit te voeren. Toch mag de complexiteit er niet toe leiden dat bedrijven het stellen van prioriteiten verwaarlozen, anders komen ze in een situatie terecht die vergelijkbaar is met het volgende geval. Volgens Gartner [3, 4, 5],
Een wereldwijde autofabrikant besloot een sentimentanalyseproject uit te voeren. Zes maanden en $10M later werden de bevindingen uit big data verspreid onder alle dealers. Alle duizenden lachten hardop omdat ze allemaal al op de hoogte waren van het geleverde inzicht.
Daarom raad ik mijn data scientist fellows aan zich te concentreren op de sleutels, niet op het licht. Ik hoop dat ik tijd vind om te schrijven over hoe deze prioritering kan worden uitgevoerd. Ik nodig u uit om uw mening en gerelateerde ervaringen toe te lichten.
Referenties:
[1] David H. Freedman (2010). Wrong: Why Experts Keep Failing Us. Little, Brown and Company. ISBN 0-316-02378-7.
[2] https://www.youtube.com/watch?v=yPGzOw_KcBk
[3] http://searchcio.techtarget.com/news/4500251611/Seven-big-data-failures-to-watch-out-for
[4] https://datafloq.com/read/top-reasons-of-hadoop-big-data-project-failures/2185
[5] http://blogs.gartner.com/svetlana-sicular/big-botched-data/