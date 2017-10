Met aandacht heb ik het opiniestuk 'Hoe opiniemakers goochelen met cijfers: in Catalonië is winst plots verlies!' gelezen op vrtnws.be. Als emeritus hoogleraar medische statistiek voel ik mij aangesproken omdat de auteur in de laatste zin - als ironisch (of is het cynisch?) grapje - ook solliciteert voor een leerstoel ‘politieke wiskunde’ aan de universiteit. (Zie tekst hiernaast).

Opinie Pieter Bauwens Hoe opiniemakers goochelen met cijfers: in Catalonië is winst plots verlies!

Daarbij wordt flagrant voorbijgegaan aan een belangrijke les uit de statistiek, met name dat men vanuit een steekproef slechts uitspraken kan doen over de populatie waaruit de steekproef getrokken is, op voorwaarde dat deze steekproef representatief is voor die populatie. Dit wil zeggen: een ‘goed beeld’ geeft van die populatie.

Wat de auteur hiermee evenwel beoogt is mij niet duidelijk. Al zegt de auteur dat niet met zoveel woorden, is de teneur van het artikel wel dat de representativiteit van een steekproef er eigenlijk niet toe doet. Men kan immers in alle mogelijke richtingen extrapoleren.

Om dat te staven, worden een aantal bizarre, waarschijnlijk ironisch bedoelde voorbeelden gegeven, zoals een extrapolatie vanuit de Catalaanse stemmers naar heel Spanje of naar alle EU-burgers, en over de non-responders in Europese verkiezingen enz…

Met recht vernoemt de auteur een cruciaal aspect in de interpretatie van statistische data, met name de representativiteit van de steekproef.

Toch blijkt de auteur zelf een volleerd expert in dat nieuwe vakgebied. Waar hij anderen ‘goochelwerk’ verwijt en aanklaagt dat statistiek misbruikt wordt om een bepaalde politieke visie te ondersteunen, past hij dit verwijt zelf met brio toe in het artikel.

Een goede representativiteit kan men best verkrijgen met een toevallige of aselecte steekproef uit de populatie. Vanuit de steekproef van Catalaanse stemmers kan men strikt gezien dus enkel een uitspraak doen over de totale Catalaanse kiezerspopulatie indien de groep stemmers een aselecte of toevalssteekproef is (of een benadering hiervan).

En daar knelt nu juist het schoentje (zoals in de meeste referenda of enquêtes). Het feit dat slechts 42,6% van de potentiële kiezers hun stem hebben uitgebracht, zegt inderdaad niets over die non-responders - wat de auteur uitvoerig vermeldt - maar zegt ook niets over de represenatitiviteit van de responders (de kiezers) - wat helemaal niet vermeld wordt.

Een selecte steekproef van 42,6% uit een populatie kan immers nooit representatief zijn voor deze populatie. En dat is geen politieke stelling maar een statistisch axioma.