Datawetenschap begint een populair traject te worden voor bepaalde mensen binnen de IT. Die groei is deels te danken aan de groei van het ruwe bronmateriaal - gestructureerde en ongestructureerde data - dat een recordgroei aan productie doormaakt. Voorheen was dit veld voorbehouden aan giganten als Google en Amazon, maar door de komst van robuuste en betaalbare datatools, van Microsofts Excel, tot Python, tot Hadoop, kan nu iedere organisatie ermee aan de slag.
Jong en nieuw
Ook geen wonder dan dat datawetenschap aan het groeien is en voor veel IT-experts met bijvoorbeeld een achtergrond in wiskunde, programmeren, of big data-applicaties een aantrekkelijk veld is. In tegenstelling tot een gebied als databasebeheer is datawetenschap een jong en nieuw veld, wat meer kansen biedt voor nieuwe professionals die bereid zijn om nieuwe vaardigheden te leren.
Jaarsalarissen van zes cijfers en tienduizenden vacatures op LinkedIn over data science hebben ertoe geleid dat verschillende bedrijven zich hebben toegelegd op het werven van datawetenschappers. Verschillende universiteiten en professionele opleiders bieden vaardigheden in analytics en data om specialisten het gereedschap te geven dat nodig is voor het beoefenen van dit beroep.
Microsoft staat bekend om zijn sterke R&D-commitment. Die is ook debet aan de werving van datawetenschappers en specialisten op het gebied van machine learning. Als je op LinkedIn kijkt, zie je dat Microsoft meer dan 400 datawetenschappers in verschillende rollen heeft, sommige in het bezit van een doctoraal. Die laatste categorie haalt Microsoft binnen door direct op universiteiten te werven en door ervaren professionals aan te nemen. We spraken met Microsoft-werver Robin McMahon om die interesse in datawetenschappers beter te begrijpen.
"Het is spannend om nu dataspecialisten te werven voor Microsoft, omdat de kandidaten vaak de kans hebben om bij verschillende afdelingen te solliciteren", vertelt McMahon, die zich richt op het aantrekken van datawetenschappers en machine learning-experts. De dataspecialisten werken uiteindelijk voor allerlei verschillende projecten, waaronder Azure, Xbox en Bing.
Geen formele opleiding
"We zoeken verschillende vaardigheden en achtergronden", legt McMahon uit. "Een manier om op te vallen is door een onderzoek naar datawetenschap te publiceren", zegt ze. Microsoft stuurt wervingsspecialisten verder naar big data-congres Strata om professionals te vinden. Het is handig als je een informaticastudie hebt gedaan, maar niet noodzakelijk. McMahon heeft professionals uit bio-informatiewetenschappen en andere informatiegebieden zien doorstromen naar Microsoft. Ook mensen die geen formele opleiding hebben gehad in informatica of datawetenschap komen ver met een beetje passie en volharding.
Hierna: van het hotelwezen naar dataspecialisme.
"Zelfstudie en een passie voor datawetenschap zijn belangrijke eigenschappen voor dataspecialisten", zegt Jeremy Stanley, onderdirecteur bij e-commerce-bedrijf Instacart. "Ik geef kandidaten liever een uitdaging die ze moeten oplossen dan dat ik simpelweg afga op een cv", voegt hij daaraan toe. "Ik wil zien hoe een sollicitant problemen aanpakt en welke code ze daarvoor bedenken." Het sollicitatieproces van Instacart is een opdracht voor thuis en vervolgens het oplossen van een probleem met een team.
Zinnen op dataspecialisme gezet
Behalve kennis van wiskunde en informatica, vindt Stanley het belangrijk dat de dataspecialisten de implicaties van bepaalde data kunnen inschatten voor klanten en producten. "Als je succes wilt hebben in dit vakgebied is het is van levensbelang dat je de juiste vragen kunt stellen en bereid bent steeds te blijven leren - of je nu aan het werk bent als dataspecialist of op zoek bent naar een baan", meent hij.
Een mooi voorbeeld dat je uit een onverwacht vakgebied kunt komen is Jade Bailey-Assam die een bachelor heeft behaald in hospitality op de Cornell-universiteit en aan de slag ging voor een grote hotelketen in Las Vegas. Ze zette haar zinnen een paar jaar geleden op datawetenschap en boekte flinke vooruitgang. Haar studie op Cornell richtte zich op de rol van informatica in het bedrijfsleven en dat gaf haar een breed begrip over technologie in bedrijfsvoering.
Begonnen met NLP
Het begon met een opdracht van de hotelketen. "In 2009 kreeg ik de taak om social media te onderzoeken voor het bedrijf. Gedurende dat proces raakte ik geïnteresseerd in sentiment-analyse en het verwerken van taal." Bedrijven willen met sentiment-analyse in kaart brengen wat mensen zeggen en vinden van een product in publieke uitingen. "Toentertijd was dat nog een behoorlijke uitdaging."
Een populaire aanpak is het analyseren van grote hoeveelheden commentaren op social media (bijvoorbeeld tweets) en deze te categoriseren in 'positief' en 'negatief'. Verschillende bedrijven hebben software geproduceerd om deze methode te ondersteunen en het komt voor een groot deel neer op het verwerken van natuurlijke taal: natural language processing (NLP).
Fascinerende introductie algoritmes
Bailey-Assam wilde haar vaardigheden verder ontwikkelen en schreef zich in bij een deeltijdopleiding aan Columbia University. Voor die tijd deed ze een paar wiskunde-cursussen op middelbare school-niveau om haar kennis te verstevigen. "Ik volgde recent een cursus over algoritmes en dat was een fascinerende introductie. Het is erg leerzaam om te zien hoe informatica problemen aanpakt door ze in simpelere componenten op te delen", vertelt ze.
"Mijn studies aan Columbia hebben direct invloed gehad op mijn werk. In een recent project werkte ik op een implementatie van Adobe Analytics voor een klant. Toen ik enkele problemen tegenkwam, kon ik dezelfde gestructureerde aanpak voor probleemoplossing gebruiken om het project af te ronden", vertelt Bailey-Assam die nu aan dergelijke analyticsprojecten werkt voor consultancy McKinsey & Co.
Gaten in datakwaliteit
"In de praktijk heb je constant gaten en andere problemen in de datakwaliteit waar je mee om moet gaan. Dus je leert vaardigheden ontwikkelen om die data op te schonen om je werk te kunnen doen", licht ze toe. Zo moet ruwe HTML-data vaak opgeschoond worden met een VBA-script om hem binnen te laten lopen bij Excel of andere tools. De tooling die Bailey-Assam gebruikt om data te gebruiken is naast Excel en Access onder meer Python, R en verschillende API's om data te bemachtigen.
Op de laatste pagina: Als je interesse hebt, moet je je niet laten afschrikken door een gebrek aan diploma's.
"Als je geïnteresseerd bent in datawetenschap, moet je niet afgeschrikt worden door een gebrek aan informatica- of wiskunde-diploma's", vindt ze. "Het is een nieuw vakgebied dus hierin nog behoorlijk flexibel. Begin met een datawetenschapcursus van bijvoorbeeld Coursera om te zien of je echt geïnteresseerd bent", zegt Bailey-Assam die begon met deze introductiecursus van de University of Washington op Coursera. "Daarna kun je een opleidingsprogramma volgen om je vaardigheden uit te breiden."
Certificering voor specialisten
In de IT zijn certificeringen een goede manier om je carrière een boost te geven en dat geldt ook voor datawetenschap. "Zo heb je Certified Analytics Professional (CAP) waarmee werkgevers kunnen zien dat je de benodigde kennis en ervaring hebt met analytics", zegt SAP-manager Polly Mitchell-Guthrie. Ze is tevens voorzitter van de Analytrics Certification Board van kennisorganisatie INFORMS, de organisatie verantwoordelijk voor CAP. INFORMS biedt overigens een hoop resources voor huidige en aspirant-datawetenschappers, inclusief informatie over analytics-conferenties, een catalogus aan publicaties en opleidingstrajecten.
"Het CAP-programma is geschikt voor zowel wiskundigen als anderen met een minder technische achtergrond, omdat het het hele analytics-proces bestrijkt", zegt Mitchell-Guthrie. "De wiskundige kan bijvoorbeeld goed zijn met het bouwen van een model, maar minder sterk zijn in het framen van het probleem en het definiëren ervan."
Groeiende marktvraag
CAP gaat over meerdere domeinen, bijvoorbeeld het oplossen van bedrijfsvragen, het framen van analytics-problemen, het bouwen van modellen en levenscyclusbeheer. De CAP is gebaseerd op een analyse van de kennis en vaardigheden die nodig zijn om analytics goed uit te voeren. De certificering is niet verbonden aan een specifieke leverancier of methode. "Het is handig om programmeerkennis te hebben of een specifieke applicatie te kunnen gebruiken, maar het is geen vereiste", aldus Mitchell-Guthrie.
Sommige werkgevers beginnen specifieke certificeringen al te vereisen van hun dataspecialisten. Doorgaans gaat dat vooral om grote bedrijven als Accenture en FedEx. "Er is een groeiende marktvraag voor vaardigheden met betrekking tot analytics, dus ik verwacht dat meer mensen voor een certrificering als CAP gaan", denkt Mitchell-Guthrie.
Bruce Harpham schrijft voor IT-projectmanagers over technologie en projectmanagement bij ProjectManagementHacks.com. Hij heeft ervaring als projectleider bij onder meer financiële dienstverleners en onderwijsinstellingen in Canada.
Reageer
Preview