Binnen sportkoepel NOC*NSF is een groep embedded scientists werkzaam. Wetenschappers, die volgens het NOC*NSF worden omschreven als: praktisch ingestelde wetenschappers met de voeten in de klei, maar die nu, door corona-gerelateerde maatregelen grotendeels werken vanuit huis. Vanuit de bestaande samenwerking tussen NOC*NSF en Sport Data Valley is daarom binnen enkele weken een online cursus programmeren ontwikkeld door Sport Data Valley op verzoek van NOC*NSF. Inmiddels zijn twee van de drie online cursusdelen al afgerond.
SDV datasteward Aart Goossens, die de masterclass samen met het data-steward team heeft ontwikkeld en zelf ook geeft zegt hierover: "De inhoud van de masterclass is tot stand gekomen aan de hand van een vragenlijst die we naar de groep embedded scientists hebben gestuurd. Uit hun antwoorden bleek dat er veel behoefte was aan een cursus over programmeren met de programmeertaal ‘R’. We hebben daarom een compacte webinaR opgezet van drie keer één uur. In die sessies, waarvan de laatste op 12 mei nog moet plaatsvinden, hebben we geprobeerd de embedded scientists te leren programmeren met deze programmeertaal.”
Zo gebruiksvriendelijk mogelijk
Met de programmeertaal ‘R’ moeten mensen die veel bezig zijn met statistiek of datascience, maar niet heel technisch aangelegd zijn, kunnen programmeren. Het idee is dat het zo gebruiksvriendelijk mogelijk is. “R wordt vooral in datascience gebruikt. Vooral door onderzoekers. Zie een wetenschapper voor je die data heeft verzameld in bijvoorbeeld Excel, en daar moet een analyse over worden gedaan. Een slim model moet erop worden toegepast en een grafiek worden gemaakt. Die grafiek moet dan weer in een artikel worden gebruikt. Dat proberen we de embedded scientists nu aan te leren.”
Samenwerking met NOC*NSF
Volgens Goossens is dit een mooi voorbeeld van de samenwerking met het NOC*NSF. “We ondersteunen in de technische analyse en expertise op het gebied van sportdata binnen NOC*NSF. Zo onderhielden we al eerder contact met de groep embedded scientists en zijn er ook twee datastewards van Sport Data Valley werkzaam op Papendal. De samenwerking nu, middels deze webinars, zorgt ervoor dat er steeds meer verbinding is tussen de verschillende projecten.”
Online analyse
De deelnemers aan het webinar hebben de mogelijkheid om via het Sport Data Valley platform met de online ontwikkelomgeving JupyterLab te werken. Het SDV platform is nu nog in betavorm en dus niet voor iedereen toegankelijk. Goossens: “In het platform staat het lesmateriaal. Dat bestaat uit interactieve documenten met code, voorbeelden en uitleg. Tijdens de webinars loop ik samen de deelnemers door deze documenten heen en de deelnemers kunnen samen mij direct aan de slag. Het is echt leuk om op deze manier al gebruik te kunnen maken van de mogelijkheden van het platform en de gekoppelde online ontwikkelomgeving”, aldus de enthousiaste Data Steward.