1 april 2021

PhD of niet: de data science vraag?

Ongeveer anderhalf jaar geleden, in de tijd dat je nog aan dezelfde tafel kon zitten met mensen die niet je directe familie waren, woonde ik de jaarlijkse bijeenkomst van de Belgische data science meetup organisatoren bij in Digityser in Brussel. Het was een informele aangelegenheid, met als doel terug te blikken op het afgelopen jaar, ervaringen uit te wisselen en te brainstormen over een gemeenschappelijke strategie voor toekomstige meetups. Zoals bij de meeste van dit soort bijeenkomsten in België, eindigde ook deze bijeenkomst met de mogelijkheid om een paar biertjes te drinken en te praten over de stand van zaken op het gebied van data science in België.

Na een paar biertjes raakte ik in discussie met Kris Peeters van Dataminded over de waarde (of het gebrek eraan) van sterke academische profielen in IT. Mensen die een van ons hebben ontmoet, weten dat we allebei nogal eigenwijs zijn en er niet voor terugschrikken om onze mening te delen, soms zelfs een beetje te sterk. Tijdens de discussie probeerde ik te beargumenteren dat doctoraten in technische vakgebieden zeer nuttig zijn voor een IT-carrière, maar Kris was het hartgrondig met me oneens.

De verhitte discussie zette me aan het denken. Ik herinnerde me dat een paar jaar eerder een recruiter me voorstelde om het feit dat ik een PhD heb te bagatelliseren tijdens een sollicitatiegesprek. Gesprekken met verschillende mensen die van de academische wereld naar het bedrijfsleven zijn overgestapt, suggereerden dat er een vooroordeel is tegen PhD-houders in de privésector. Ik heb altijd het gevoel gehad dat mijn academische carrière me heel goed heeft voorbereid op de rol van datawetenschapper, maar misschien had Kris gelijk met zijn kritiek. Misschien was mijn mening bevooroordeeld door mijn eigen ervaring?

Huidige situatie in het hoger onderwijssysteem van de EU en de IT-arbeidsmarkt

In mijn zoektocht naar antwoorden was ik verrast door het gebrek aan openbaar beschikbare gegevens over de houding van werkgevers ten opzichte van PhD's. Mijn eigen poging om het veld te onderzoeken mislukte ook, met een handvol mensen die antwoorden gaven en alleen onthulden dat mensen met een PhD geloven dat hun diploma's waardevol zijn voor een IT-carrière, maar niet veel zeiden over de houding ten opzichte van PhD's in het algemeen.

Ik heb echter verschillende EU-rapporten over dit onderwerp kunnen vinden. Het rapport uit 2015 over de behoefte aan STEM profielen op de arbeidsmarkt bevestigde de bezorgdheid van Kris:

"Er is ook bezorgdheid over mismatches van meer kwalitatieve aard, bijvoorbeeld als gevolg van een toenemende ICT-intensiteit in de economie, door technologische convergentie en veranderingen in het type taken dat bij STEM beroepen komt kijken, die niet altijd worden weerspiegeld in het ontwerp van hogeronderwijsprogramma's."[1]

Vertaling: STEM curricula bereiden mensen niet goed voor op een loopbaan in de industrie. Het rapport noemt ook het gebrek aan werkervaring als belemmering voor STEM opgeleide profielen om in de commerciële sector aan de slag te gaan. Dit geldt ook voor PhDs, hoewel het enigszins absurd is dat jaren van onderzoek en onderwijs niet worden meegerekend als "werkervaring".

Er is een duidelijke discrepantie tussen de vaardigheden die werkgevers verwachten van profielen met een STEM opleiding en wat het onderwijssysteem daadwerkelijk biedt. Hier lijkt Kris een goed punt te hebben, en mijn eigen ervaring in het hoger onderwijssysteem van de EU bevestigt een aantal van deze vooroordelen.

Zo volgen sommige STEM onderzoeksgroepen nog steeds een piramidaal organisatieschema, waarbij de hoogleraar in wezen de CEO van de onderzoeksgroep is, ondersteund wordt door een laag postdocs die het operationele deel van het werk uitvoeren en de werktaken delegeren aan PhD's en masterstudenten. In dit schema is de PhD student gericht op het uitvoeren van taken, praat hij zelden met zijn PhD-adviseur en wordt hij vaak afgeschermd van het "grote plaatje" van het onderzoeksproject. Ze zijn meestal niet betrokken bij het schrijven van onderzoekspapers, maar leveren in plaats daarvan "bijdragen" aan de resultaten die in de onderzoekspapers worden gepresenteerd. Een dergelijk onderwijssysteem zal natuurlijk profielen voortbrengen die niet goed aansluiten bij de profielen die nodig zijn in de IT-industrie, omdat er te weinig nadruk wordt gelegd op de ontwikkeling van soft skills en analytische denkvaardigheden.

De piramidale onderzoeksstructuur komt steeds minder voor, en dat is goed, maar hoe sneller deze volledig wordt uitgebannen uit het hoger onderwijssysteem, hoe beter!

De vraag naar STEM profielen zal in de nabije toekomst aanzienlijk toenemen, aangezien de EU-economie steeds innovatiegerichter wordt. De EU is zich bewust van dit probleem en er zijn verschillende initiatieven genomen om de brug tussen de academische wereld en het bedrijfsleven te slaan. Zo bieden de Innovative Training Network programma's, gefinancierd door de Marie Curie Actions, PhD-studenten mogelijkheden voor stages in de privésector om de overdraagbaarheid van hun vaardigheden en de niet-academische werkervaring te verbeteren.

Mijn mening over de waarde van een STEM doctoraat in data science

Ik vond het altijd vanzelfsprekend dat een PhD in deeltjesfysica me goed voorbereidde op een carrière in data science. Ik heb er nooit echt rekening mee gehouden dat mijn academische ervaring misschien niet representatief is voor alle STEM doctoraatsprogramma's.

Ik behaalde mijn doctoraat in de VS en bracht 3 jaar door in Israël als post-doc voor ik naar België kwam voor een tweede post-doc. Zowel de VS als Israël hebben een academische omgeving die de nadruk legt op kritisch denken en sterke communicatievaardigheden bovenop de technische aspecten van onderwijs en onderzoek. Dit was ook het geval aan de UCLouvain, waar ik mijn tweede postdoc deed.

Europeanen beschrijven Amerikaanse en Israëlische academici vaak als "agressief", omdat ze niet aarzelen om sterke beweringen te doen in presentaties of de spreker op elk punt uit te dagen. Daar zit een kern van waarheid in. Als je me niet gelooft, probeer dan maar eens een lezing te geven aan het Weizmann Instituut en zie hoe een eerstejaars masterstudent je ideeën publiekelijk aan stukken scheurt voor een zaal vol mensen. Het is op zijn zachtst gezegd een transformerende ervaring, maar wel een die veel kan helpen in de privésector: je moet kunnen opkomen voor je ideeën en je werk. Er zijn geen mensen of bedrijven die succesvol zijn geworden door onzeker te zijn.

Tijdens mijn PhD-carrière heb ik veel tijd besteed aan het bespreken van deeltjesfysica met mijn adviseur. Tijdens de hete zomermaanden in het midwesten vonden deze discussies vaak plaats op de veranda van zijn koloniale huis, onder het genot van een glas koude limonade of spuitwater (altijd een goed idee om je hersenen op gang te brengen). Ik leerde net zoveel van deze discussies als van de cursus. Niet alleen over natuurkunde, maar ook over kritisch denken. We lazen preprints van recente artikelen over deeltjesfysica en probeerden ze te begrijpen, uit te dagen en mazen in hun argumenten te vinden. Dit was een manier om mogelijkheden te ontdekken voor onze eigen onderzoeksrichtingen. We deden hetzelfde met ons eigen werk om er zeker van te zijn dat we niets belangrijks over het hoofd zagen.

Tot op de dag van vandaag pas ik dezelfde zelfkritische benadering toe op al het datawetenschappelijk werk dat ik doe bij B12, en ik dank het allemaal aan mijn PhD-opleiding.

Mijn ervaring met Europees hoger onderwijs was dat de Europese academische "stijl" anders is (niet slechter, gewoon anders). Seminarbesprekingen op Europese universiteiten zijn meer terughoudend, met veel minder vragen en onderbrekingen. Deels is dit waarschijnlijk cultureel bepaald, maar het gaat gepaard met een meer uitgesproken gevoel van hiërarchie en ik heb altijd het gevoel gehad dat studenten over het algemeen te weinig zelfvertrouwen hadden om op te staan en hun standpunt te verdedigen. Aan de UCLouvain was ik heel blij dat ik van mijn adviseur de kans kreeg en zelfs werd aangemoedigd om mijn onderzoeksideeën te verkennen, hoe gek ze ook waren. Mijn werk en ideeën hebben me echter wel een paar keer in de problemen gebracht met andere faculteitsleden. De meeste Europese universiteiten eisen tegenwoordig van studenten dat ze papers schrijven en mondelinge presentaties geven om hun diploma te halen, maar ik heb de indruk dat de nadruk op deze vaardigheden in Europa veel minder uitgesproken is dan bijvoorbeeld in de VS.

Voor een PhD moet je snel kunnen leren, en snel leren is een vaardigheid die je zelf moet leren. Er is meestal zoveel materiaal dat je snel moet kunnen opnemen en begrijpen. Ik heb dit gedaan door eerst een solide basis in wiskunde en natuurkunde te ontwikkelen waarop ik gemakkelijk kon voortbouwen. Het vinden van overeenkomsten tussen nieuwe onderwerpen en onderwerpen waar ik al bekend mee was, hielp me om de stof sneller te leren. Hoe meer ik leerde, hoe makkelijker ik het kon aanvullen.

Mijn PhD-programma had ook een regel dat elke student minstens één seminar presentatie per semester moest geven. De meeste mensen deden het vaker. Dit betekende dat je minstens 10 keer voor een zaal vol mensen moest staan en je ideeën moest verdedigen voordat je je proefschrift verdedigde (conferentie- en workshopgesprekken niet meegerekend). Mijn PhD adviseur pushte me ook om al onze papers persoonlijk te schrijven. Ik ben hem hier eeuwig dankbaar voor, ook al was het soms een frustrerende ervaring. Door al het bovenstaande heb ik vertrouwen ontwikkeld in spreken in het openbaar en het vermogen om mijn ideeën duidelijk en efficiënt over te brengen.

Toen ik de academische wereld verliet om bij B12 te gaan werken, vond ik dat de vaardigheden die ik had opgedaan tijdens mijn PhD-jaren me goed hadden voorbereid op een rol als datawetenschapper: Ik had alle technische, analytische en communicatieve vaardigheden die ik nodig had, een sterke wiskundige en natuurkundige achtergrond (ja, veel natuurkunde is nog steeds erg nuttig in mijn dagelijkse werk) en het vermogen om snel te leren. Ik heb nog steeds het gevoel dat datawetenschap aan de basis een onderzoeksdiscipline is.

De overgang verliep echter niet helemaal vlekkeloos. Ik moest opnieuw leren coderen omdat de standaarden voor softwareontwikkeling in de academische wereld ongeveer 10 jaar achterlopen op de commerciële IT-sector.
Hoewel de manier waarop ik data science problemen benader en de manier waarop ik academische onderzoeksproblemen aanpak vergelijkbaar is, moest ik afleren dat je in de academische wereld in wezen oneindig veel tijd hebt om aan een probleem te werken. In de privésector, en vooral in consultancy, zijn de middelen voor je project beperkt en moet je leren hoe en wanneer je moet stoppen. De focus van je inspanningen is ook anders. In de academische wereld heeft het begrijpen van een probleem op zich al waarde, zelfs als je geen oplossing vindt. In commerciële datawetenschap is elk project een investering en het resultaat moet op een bepaald niveau waarde genereren (d.w.z. geld verdienen of besparen).

Mijn indruk is dat het aanleren van alle relevante IT-vaardigheden die ik als promovendus niet had, heel goed mogelijk was tijdens mijn werk. Ik blijf er echter bij dat het veel moeilijker is om buiten de academische wereld de vaardigheden te leren die ik tijdens mijn PhD heb ontwikkeld: analytisch denken, een solide basis in wiskunde, het vermogen om snel te leren... deze vaardigheden ontwikkel je door een paar jaar in de loopgraven van de wetenschap te werken.

Tot slot denk ik dat het eerlijk is om te zeggen dat er maar één soort persoon is die een PhD haalt: het soort dat oprecht nieuwsgierig is naar hoe de wereld werkt. Het soort dat volhardend is, maar toch flexibel en creatief. En het is precies deze combinatie van nieuwsgierigheid, flexibiliteit en creativiteit die geweldige datawetenschappers maakt.

Is een doctoraat in STEM een troef voor een carrière in data science?

Mijn korte antwoord op deze vraag is: ja.

Het lange antwoord zou ongeveer zo luiden:

Het is duidelijk dat er een mismatch is tussen de vaardigheden van PhDs en wat de industrie verwacht, maar over het algemeen denk ik dat de meeste mensen met een STEM doctoraat deze kloof kunnen overbruggen. Het feit dat er op Europees niveau verschillende initiatieven zijn om een brug te slaan tussen de industrie en de STEM academische wereld geeft me vertrouwen dat de situatie in de toekomst zal verbeteren.

Houd in gedachten dat het bij een PhD niet gaat om het diploma, maar om de vaardigheden die je ontwikkelt tijdens je PhD. Dit zijn onder andere sterke analytische en kritische denkvaardigheden, het vermogen om snel te leren en sterke communicatieve vaardigheden, bovenop alle technische vaardigheden die je krijgt als onderdeel van je STEM curriculum.

Als je een doctoraatsprogramma overweegt, moet je ervoor zorgen dat je eruit komt met de bovengenoemde overdraagbare vaardigheden. Als je PhD neerkomt op iemand die je taken geeft om uit te voeren zonder je te vragen erover na te denken in de context van het grote geheel, als je je hele PhD doorbrengt zonder een paper te schrijven of een lezing te geven, dan doet je PhD-programma je tekort. Dit is zowel relevant als je je academische carrière voortzet als wanneer je overstapt naar het bedrijfsleven.

Onze ervaring bij B12 is dat sterke academische profielen, vooral doctoraten in STEM, een uitzonderlijke waarde toevoegen aan ons team en het wetenschappelijke DNA van B12 als innovatiebedrijf bepalen.

We verwachten dat onze datawetenschappers kunnen fungeren als wetenschappelijke huurlingen: getraind in guerrillatactieken van dataoorlogvoering, in staat om zich aan te passen aan elk domein en creatieve oplossingen te ontwikkelen voor elk datagedreven probleem. STEM doctoraten passen meestal heel goed in deze rol! Op dit moment heeft ongeveer 40% van ons team een PhD, en we blijven actief zoeken naar STEM PhD's in het wervingsproces.

Dit wil niet zeggen dat je geen geweldige datawetenschapper kunt zijn als je geen PhD hebt. Ongeveer de helft van ons datawetenschappersteam heeft geen PhD en ze zijn allemaal erg goed in hun werk! Maar toen ze werden aangeworven, werden ze bovenal aangeworven vanwege hun analytisch denkvermogen en hun vermogen om snel te leren, en dat zijn de vaardigheden die vanzelfsprekend zouden moeten zijn voor iemand met een PhD in STEM.

  1. [1]
  2. Does the EU need more STEM graduates: final report, 2015.

Mihailo Backovic, Managing Partner

Wil je een project starten?

Let‘s talk