Om te solliciteren op deze stage, moet je met je HvA-emailadres een account aanmaken.

account aanmaken

Bedrijfsinformatie

RIVM
Antonie van Leeuwenhoeklaan 9
3721MA
Bilthoven

Stagiair data science COVID-19 Surveillance CAS-BES eilanden


De stagiair zal zich bezig houden met het (verder) automatiseren van COVID-19 surveillance data vanuit de CAS-BES eilanden. Denk hierbij aan het automatisch inlezen, opschonen en combineren van de verschillende CAS-BES databronnen en het maken van een automatische rapportage.

Rijksinstituut voor Volksgezondheid en Milieu (RIVM)

Centrum Infectieziektebestrijding (CIb)

Centrum Epidemiologie en Surveillance van Infectieziekten (EPI)

Afdeling Data, innovatie en signalering (DIS), Afdeling Respiratoire Infectieziekten (RES)

 

Duur: 4-5 maanden (periode in overleg)

Aanvang: Bij voorkeur september 2022 (evt. later)

 

Achtergrond:

Het centrum EPI creëert inzicht in het vóórkomen en de verspreiding van infectieziekten, waaronder COVID-19. Hierbij worden diverse gegevens verzameld, bewerkt, geanalyseerd en vervolgens gerapporteerd ten behoeve van een adequate uitvoering van de infectieziektebestrijding.

 

Het Koninkrijk der Nederlanden bestaat uit vier landen: Nederland, Aruba, Curaçao en St Maarten (CAS-eilanden). Ook heeft Europees Nederland drie bijzondere gemeenten, bekend als Caribisch Nederland oftewel Bonaire, St. Eustatius (Statia) en Saba, de BES-eilanden. Het RIVM heeft binnen infectieziekten bestrijding conform de IHR-richtlijnen een ondersteunende rol voor zowel de CAS als de BES eilanden.

 

Met betrekking tot de COVID-19 pandemie zijn de surveillance datastromen vanuit de CAS-BES eilanden anders ingericht dan de datastromen voor Europees Nederland. Hieronder vallen data zoals aantal SARS-CoV-2 meldingen, COVID-19 gerelateerde ziekenhuisbezetting, en data uit bron- en contactonderzoek (BCO). De BES-eilanden melden deze data in het registratiesysteem OSIRIS voor alle meldingsplichtige infectieziekten[1]. Daarnaast leveren zij geanonimiseerde data aan voor het monitoren van virusvarianten en de zorgcapaciteit. Vanuit de CAS-eilanden worden er gepseudonimiseerde databestanden toegestuurd. Al deze databestanden worden ingelezen in het softwarepakket R en vervolgens verder verwerkt. Aangezien de verschillende datastromen zich gedurende de COVID-19 pandemie hebben uitgebreid, moeten ook de bestaande R-scripts periodiek worden herzien. Wij zijn hiervoor op zoek naar een stagiaire die het leuk vindt om aan de slag te gaan met coderen in R.

 

Vraagstellingen

De stagiair zal zich bezig houden met het (verder) automatiseren van COVID-19 surveillance[2] data vanuit de CAS-BES eilanden. Denk hierbij aan het automatisch inlezen, opschonen en combineren van de verschillende CAS-BES databronnen en het maken van een automatische rapportage.

 

Materiaal en methode

  • OSIRIS data BES-eilanden en soortgelijke data CAS-eilanden
  • Kiemsurveillance data (virusvarianten)
  • Statistisch software programma R

 

Werkzaamheden

-         Surveillance datastromen vanuit de zes eilanden inlezen en deze je eigen maken;

-         Waar nodig, bestaande scripts aanpassen en nieuwe scripts ontwikkelen;

o   Scripts gericht op dagelijkse data (t/m mei 2022) en wekelijkse data (vanaf mei 2022) op een bruikbare manier hernieuwen, opslaan en archiveren;

o   Aanpassen bestaande scripts aan nieuwe populatie aantallen van CBS voor de CAS-BES eilanden;

-         Waar nodig, bestaande rapporten aanpassen;

o   GGD rapporten voor de BES-eilanden hernieuwen op basis van bestaande scripts en aangepaste databronnen;

o   Openbare rapporten bijstellen aan aanpassingen in grafieken of tabellen;

-         Opstellen van een script dat meerdere databronnen aan kiemsurveillance data koppelt, en hier een geschikte output voor opstellen;

 

 

 

 

Mogelijkheid tot zelfstandig werken; technieken die geleerd kunnen worden

Deze stage betreft geavanceerde toepassing van R. In deze stage doe je kennis op en ontwikkel je expertise op het gebied van R en datastromen (data engineering) en doe je vaardigheid op over het vertalen van data naar inzichtelijke outputs waarbij je geholpen wordt door ervaren data scientists en epidemiologen. De stagiaire maakt onderdeel uit van het Data analytics, research and automated reporting team (DARA) in het centrum.

 

Verwacht product

Het opstellen van een geautomatiseerd script in R dat meerdere databronnen inleest, analyseert en verwerkt tot een passende output (o.a. grafieken en tabellen). Gedurende de stage zal de stagiair zich vooral kunnen verdiepen in de techniek en indien gewenst ondersteuning kan bieden bij technische vraagstukken gericht op surveillance data van de CAS-BES eilanden. Scripts en werkprocessen moeten overeenkomen met de DARA structuur en stijl.

 

Begeleiding

  • Steven Nijman, data scientist DARA (DIS, CIb)
  • Danytza Berry, epidemioloog COVID-19 Surveillance CAS-BES eilanden (RES, CIb)

 

Vereisten

  • Kennis van en ervaring met programmeren in R in tidyverse
  • Technische expertise voor data engineering en analyse

 

Gewenste voorkennis

  • Bij voorkeur een student die op zoek is naar een afstudeeropdracht voor een bachelor opleiding in de richting van ICT, data science of iets vergelijkbaars
  • Flexibel en in staat om snel te schakelen wanneer nodig (er zal soms tijdsdruk zijn)
  • Affiniteit met (epidemiologische) data
  • Ervaring met Rmarkdown is een pré
  • Enige affiniteit voor de overzeese Rijksdelen is een pré

 

[1] Meer over OSIRIS: Meldingsplichtige infectieziekten | RIVM

[2] Met uitzondering van vaccinatiedata

Geschikt voor studenten
  • Business IT & Management
  • Software Engineering
  • System and Network Engineering/Cyber Security
  • Technische Informatica