Binnen e-commerce is het vanuit business en economisch perspectief belangrijk om de meest inzichtrijke relaties en aspecten in een dataset te visualiseren in een zogenoemd interactief dashboard. Om een geschikte visualisatie te kunnen maken die waardevol is voor stakeholders moeten er echter veel handelingen en arbeidsintensieve werkzaamheden worden verricht. Real-time dashboarding kan in hierbij waardevol zijn. In een zogenoemde geautomatiseerde processing pipeline dienen alle noodzakelijke verwerkingsstappen aan bod te komen: van data ophalen en data schoonmaken (validatie en eventueel interpolatie en/of extrapolatie) tot data analyse (segmentatie in bijvoorbeeld clusters) en data rendering (weergave).
- Een eerste doel van deze opdracht is om een daadwerkelijke pipeline vorm te geven en in te vullen (ontwerpen) voor een concrete dataset. Hierbij kan er eerst via een kort literatuuronderzoek in kaart worden gebracht wat gangbare pipelines in marketing analytics zijn en waarop gelet dient te worden.
- Een tweede doel is om te onderzoeken of volledige automatisering mogelijk is en/of real-time processing haalbaar is. Bij dit laatste doel ligt de nadruk op daadwerkelijk bouwen (programmeren).
De dataset waar je mee gaat werken en het uiteindelijke dashboard dat daarop is gebaseerd worden in de afstudeeropdracht bepaald in overleg met representatieve stakeholders (intern, in het Centre for Market Insights, of extern).
Bij het uitvoeren van deze afstudeeropdracht ligt de nadruk op het ontwerpen en opleveren van een software architectuur die het mogelijk maakt om kwantitatief empirisch onderzoek uit te voeren via dataexploratie en analyse. Onder het laatste valt wellicht datavergaring via het toepassen van data mining technieken zoals web crawling of web scraping van websites en/of via een API (Application Programming Interface). En daarnaast gevorderde statistiek en data analyse, zoals content analyse en natural language processing aan de hand van machine learning.