(c) Copyright 2020, dpa (www.dpa.de). Alle Rechte vorbehalten

Statistiek in tijden van corona

Wie heeft nog vertrouwen in cijfers? Er zijn leugens, grote leugens, en er is statistiek, hoor je wel eens zeggen. Gelukkig is er de Werelddag van de Statistiek, vandaag dus, om er ons op te wijzen dat dat zo niet hoeft te zijn. 

Over heel de wereld wordt vandaag de derde World Statistics Day gevierd met als thema “Connecting the world with data we can trust”. De voorbije maanden toonde de Covid-19-pandemie meer dan ooit de noodzaak aan van kwaliteitsvolle dataverzameling en –analyse om tot wetenschappelijk onderbouwde beleidsbeslissingen te komen. 

De ongeziene impact van de Covid-19-maatregelen op onze gezondheidzorg, onze economie en ons welzijn maakt ons allemaal betrokken. Elke beslissing om maatregelen al of niet te nemen wordt dan ook door opiniemakers, media en academici onder de loep genomen.

We zijn nog nooit zo bedolven geworden onder cijfers, en toch weerklinkt de roep om toegang tot nog meer data en om meer transparantie over de besluitvorming luider dan ooit. Op deze World Statistics Day houden we dan ook een pleidooi voor betere data-infrastructuur, meer statistische geletterdheid en het erkennen van de onzekerheid.

Corona-data komen niet uit de lucht gevallen. Toegankelijke bruikbare data vereisen een goede infrastructuur die gebouwd wordt met een duidelijke langetermijnvisie. Elke crisis heeft specifieke noden, maar als overheid moet men durven investeren in een goede basisinfrastructuur waarop we te allen tijde kunnen terugvallen.

Vandaag lijkt het binnen de aanpak van Covid-19 bijvoorbeeld bijzonder moeilijk om diverse bronnen van informatie die verzameld worden op verschillende niveaus, zoals testresultaten van labo’s, geografische en demografische gegevens, Locator-Passenger-formulieren,  contact-tracing,…  te linken. Het combineren van deze informatie op basis van het rijksregisternummer lijkt triviaal in theorie, maar de praktijk bewijst jammer genoeg het tegendeel.

Nochtans is de combinatie van dergelijke data – met respect voor de GDPR (General Data Protection Regulation) -  cruciaal om zicht te krijgen op bijvoorbeeld transmissieclusters, wat op zijn beurt kan leiden tot veel gerichtere maatregelen in de strijd tegen Covid-19.

Het gebrek aan investeringen in performante datasystemen is door de coronacrisis nog duidelijker naar boven gekomen, en is niet beperkt tot België maar een wereldwijd probleem. De recent uitgesproken ambities rond digitalisering door de Vlaamse en federale regering bieden hier alvast opportuniteiten.

Het valt toe te juichen dat in de nieuwe eindtermen van het secundair onderwijs elke leerling met data leert werken

Na het verzamelen van de data wacht de uitdaging om de cijfers tot leven te brengen. Statistiek is de taal van de cijfers, en zou idealiter duiding moeten brengen en de onzekerheid die inherent is aan statistische besluitvorming kaderen.

De waarheid gebiedt ons te stellen dat dit de voorbije maanden in heel het corona-verhaal vaak niet gebeurde. Integendeel, de coronacrisis leek soms wel de ideale voedingsbodem tot het versterken van de gedachte “There are lies, damned lies and statistics”.  

Oneliners op sociale media en presentaties van grafieken in mainstreammedia zonder duidelijke context, selectiviteit in het naar voor schuiven van resultaten (cherry-picking) die best passen binnen het verhaal van expert X (al of niet als reactie op expert Y), voorspellingen van aantal positieve testen of dodelijke slachtoffers bij het al of niet nemen van bepaalde maatregelen die achteraf helemaal fout blijken, associaties gevonden op basis van data die te snel causale interpretaties krijgen, … hebben hier helaas toe bijgedragen.

Het vergt van de burger heel wat statistische geletterdheid om nog een weg te vinden door dat kluwen van soms tegenstrijdige informatie. Los van de coronacrisis leven we sowieso in een tijdperk waarin langs allerlei kanalen massaal veel data worden verzameld, en krijgen we dagelijks de meest zinnige en onzinnige conclusies op basis van die data te lezen. Het valt dan ook toe te juichen dat in de nieuwe eindtermen van het secundair onderwijs elke leerling met data leert werken en die leert te interpreteren. Dit biedt kansen in de toekomst tot een kritischere houding ten aanzien van data.

Deze pandemie is een les in bescheidenheid voor statistiek als discipline

Een goede statistische geletterdheid voor iedereen kan echter niet gelijk gesteld worden aan “iedereen statisticus”, ook al lijkt de crisis het “statistisch profiel” van onderzoekers, wiens expertise elders ligt, te hebben versterkt. Zoals voor veel wetenschappelijke disciplines is deze pandemie een les in bescheidenheid voor statistiek als discipline.

Bij deze pandemie spelen zoveel bekende en nog onbekende factoren mee die de aanpak van het virus ongezien complex maken. Hierbij speelt naast de nog steeds onvolledige kennis over hoe het virus zich verspreidt ook ons menselijk gedrag een cruciale rol, en laat dit nu net heel onvoorspelbaar zijn.

Binnen multidisciplinair overleg dat het puur virologische aspect overstijgt speelt de statisticus een belangrijke rol om de beperkingen van bevindingen en de onzekerheid te duiden. Op die manier kan de nodige nuance in het wetenschappelijk debat gebracht worden.

Die onzekerheid maakt het echter niet evident om de huidige kennis om te zetten in eenvoudige beleidsmaatregelen. Heldere communicatie en transparantie zoals beloofd in het federaal regeerakkoord zijn dan ook noodzakelijk om ons als burgers in deze crisis verbonden te voelen door data die we kunnen vertrouwen.

VRT NWS wil op vrtnws.be een bijdrage leveren aan het maatschappelijk debat over actuele thema’s. Omdat we het belangrijk vinden om verschillende stemmen en meningen te horen publiceren we regelmatig opinieteksten. Elke auteur schrijft in eigen naam of in die van zijn vereniging. Zij zijn verantwoordelijk voor de inhoud van de tekst. Wilt u graag zelf een opiniestuk publiceren, contacteer dan VRT NWS via moderator@vrt.be.

Meest gelezen