Thesis

& 153 SAMENVATTING voorspellingen te verkrijgen. Data analytics impliceert het gebruik van verschillende statistische en machine learning technieken. Data analytics wordt echter niet veel gebruikt in gedrags-, bewegings- en sportwetenschap. Daarnaast staat het gebruik van Artifical Intelligence en machine learning op basis van wearable- en monitoringsysteemdata in de sport nog in de kinderschoenen. Hoewel data analytics kansen biedt, zijn er problemen bij het extraheren van zinvolle, persoonlijke inzichten en het realiseren van voorspellingen op basis van fysieke activiteits- en prestatiegegevens. Vier geïdentificeerde problemen creëren een data-analytics kloof. Voor elk van vier geïdentificeerde problemen stellen we mogelijke oplossingen voor. Een eerste probleem is het beperkte gebruik van gepersonaliseerde gegevens en geïndividualiseerde voorspellingen en inzichten. Om geïndividualiseerde inzichten en voorspellingen te kunnen geven, is het een randvoorwaarde dat de gegevens voldoende persoonlijke informatie bevatten. Een mogelijke oplossing is het gebruik van gepersonaliseerder gegevens uit wearables zoals Fitbit of Garmin of optische volgsystemen zoals SportsVU om geindividualiseerde inzichten en voorspellingen te kunnen geven. Een tweede probleem is de enorme hoeveelheid en complexiteit van gegevens, waardoor het een uitdaging is om nauwkeurige voorspellingsmodellen te creëren. Een mogelijke oplossing is om meer sensitieve fysieke prestatieindicatoren te gebruiken en in combinatie met verschillende machine learning-algoritmen de beste voorspelmodellen te selecteren. Een meer sensitieve prestatieindicator is beter in staat veranderingen in de gegevens van het gemeten systeem te detecteren. Het derde probleem betreft het gebruik van vereenvoudigde modellen van de werkelijkheid en hypotheses die onrealistische aannames doen over werkelijkheid, waardoor de waarde van inzichten wordt beperkt. De mogelijke oplossing is het toepassen van een causale roadmap gecombineerd met een causaal model. De causale roadmap schrijft strikt voor welke stappen er in een analyse genomen moeten worden en expliciteert de onderliggende aannames. Waarbij een causaal model inzichtelijk maakt hoe de werkelijkheid gemodeleerd is en welke variabelen buiten beschouwing zijn gelaten. Het vierde probleem is het ontbreken van variabelen in de gegevens die de gemeten fysieke activiteiten en prestaties kunnen beïnvloeden. Een voorbeeld daarvan zijn contextuele variabelen in voetbal zoals een uit- of thuiswedstrijd of het weer. Er zijn twee potentiële methodologische oplossingen. De eerste oplossing maakt gebruik van statistische methoden die om kunnen gaan met ontbrekende variabelen. De tweede vergelijkt traditionele statistische analyse met machine learning om te kijken welke methode betere inzichten en voorspellingen levert als er variabelen ontbreken. Het doel van dit proefschrift is om de kloof in data analytics te reduceren door de vier geïdentificeerde problemen aan te pakken. Door de bijbehorende potentiële oplossingen te onderzoeken kan het mogelijk worden om zinvolle inzichten en voorspellingen te

RkJQdWJsaXNoZXIy MjY0ODMw