Naam:  Wachtwoord:   Ingelogd blijven? Wachtwoord kwijt? (Waarom) Registreren
 
          
                         
Dit is het archief van Islamofobie.nl
Sinds juli 2014 verschijnen hier geen nieuwe stukken meer. De artikelen worden *) heringedeeld in acht categorieën: zie de knoppen links. Met uitzondering van de categorie 'Islam(itische ideologie)' is de indeling nu niet meer naar thema, maar naar aard van de stukken. Vier jaar lang lag het hoofdaccent op het voeren van de noodzakelijke ideologische strijd: zie het motto hierboven. In de komende jaren zal ik (initiatiefnemer en belangrijkste leverancier van teksten voor islamofobie.nl) me meer richten op de noodzakelijke politieke strijd. In termen van deze indeling: veel meer nadruk op Voorstellen, Politieke organisatie en iets meer op Opinie. LEES VERDER »
 
 
Lies, damned lies and statistics

Statistiek heeft geen goede naam. De bekende kreet die ik als titel heb meegegeven aan dit stukje, drukt dat goed uit. Het is zeer treurig dat de statistiek zelf, als tak van wetenschap, daardoor een slechte naam heeft gekregen.
Het artikel waar ik in de tweede zin naar linkte, gaat over de herkomst van de uitdrukking. De anonieme (!) auteur van het stuk schrijft dat de uitdrukking noch van Disraeli noch van Mark Twain afkomstig is, maar van een anonimicus en wijst er op dat "It is possible that in its original form the quotation referred to expert witnesses rather than statistics" terwijl "…expert witnesses are allowed to give evidence as to what is their opinion, and hence are out of the reach of an indictment for perjury [=meineed], which always hangs over the head of the ordinary witness, who can testify to fact only".
Was die associatie maar in stand gebleven! In de handen van integere wetenschappers is statistiek een uitstekend en geweldig praktisch toepasbaar onderdeel van de wiskunde, die schitterende wetenschap.
Statistiek leent zich echter heel goed voor het bedrieglijk voorstellen van feiten. De pijlen zouden gericht moeten worden op de niet-integere misbruikers in plaats van op de wetenschap.
»

Op basis van mijn recente ervaringen op de Havo en het VWO -als docent wiskunde bedoel ik, niet als leerling- weet ik dat daar de leerlingen al onderwezen worden op twee totaal verschillende terreinen die allebei wel als statistiek worden aangeduid: de beschrijvende statistiek en de waarschijnlijkheidsleer. Bij de beschrijvende statistiek gaat het om afbeeldingen die in gecomprimeerde vorm, vaak in een oogopslag, heel veel informatie weergeven. Bij de waarschijnlijkheidsleer, nauwkeuriger gezegd: de leer van het toetsen van hypotheses, gaat het in zekere zin vaak om het omgekeerde. We hebben dan geen grote hoeveelheid informatie die gecomprimeerd weergegeven wordt, maar juist een beperkte hoeveelheid informatie, informatie uit steekproeven, waarvan we ons afvragen met hoeveel zekerheid die beperkte hoeveelheid gegevens iets kunnen zeggen over de totale 'populatie'.
Op beide terreinen is het mogelijk om de wetenschap te misbruiken. Met name voor de beschrijvende statistieken worden middelbare scholieren al in hun wiskundeboek op dat gevaar gewezen. Ook VMBO-leerlingen trouwens. Het bekendste voorbeeld is het verdoezelen van de zogenaamde scheurlijnen.

imageEen paar minuten googlen leverde me al een schitterend voorbeeld hiervan. Afkomstig van een bedrijf dat promotionele artikelen verkoopt.
Door in de onderste grafiek niet op nul te beginnen, zelfs geen scheurlijntje aan te brengen, wordt de indruk gewekt dat de omzet in dit soort artikelen sneller steeg dan de prijs van olie. Kijk je wat beter naar de cijfers die er bij staan dan kun je eenvoudig uitrekenen dat de olieprijs in 2010 met ca 32% steeg en de omzet van de promo artikelen met 8%!

Een ander voorbeeld. Ik geef u grafiekjes van het aantal bezoekers (geel) en hits (geel+rood) van Keizers & Kleren'. Ze zijn zo van het scherm gekopieerd vanuit de tool 'sitemeter'. Wanneer ik u, valselijk, de indruk wilde geven dat die aantallen zijn geëxplodeerd op een werkelijk nog nooit eerder vertoonde wijze, gaf ik u alleen de linkergrafiek. Wil ik de indruk wekken dat het niet zo goed gaat met de ontwikkeling van het aantal bezoekers dan gaf ik de rechtergrafiek. Overigens deugen beide grafieken niet. Ze zijn wel echt gebaseerd op de feiten, met de balkjes heb ik niet geknoeid en er is ook geen scheurlijn weggelaten. Bij beide ontbreekt echter de cijfermatige beschrijving van de verticale as. In de rechter grafiek kun je bovendien niet zien welk deel van de maand juni al verstreken is: zou de maand al bijna voorbij zijn dan was het aantal bezoekers gekelderd. Is de maandgrafiek daarentegen van 2 of 3 juni dan gaat de suggestie ervan uit dat het aantal juist door het dak gaat!
image
Voor wie een goed stel hersens heeft, is eigenlijk intuïtief al duidelijk dat bij het 'toetsen' van hypotheses er nog meer mogelijkheden zijn om een bedrieglijke voorstelling van zaken te geven van bepaalde cijfers. En dan denk ik niet eens aan het zogenaamde hockeystick-bedrog dat in het logo van deze K&K-rubriek 'wetenschappelijke fraude' terug te vinden is: opzettelijk onduidelijk zijn over de herkomst van gegevens. Ik wijd hier nu niet over uit: deze onderwerpen komen in latere stukken terug.

Voor vandaag sluit ik af men een anekdotisch verhaal uit mijn praktijk als student-assistent statistiek aan de KUB, die toen, in 1978, nog de KHT heette. Voor de eerstejaarsstudenten psychologie was statistiek een van de vier vakken. Omdat een van de laatste vakken die ik aan de TH-Delft (nu: TU) had afgesloten statistiek was, ging ik als een speer door dat vak heen en vroeg de docent aan mij in de tweede maand van het studiejaar of ik misschien student-assistent wilde worden. In januari was een en ander rond en was ik dus assistent voor mijn collega-eerstejaars geworden! Aan het einde van het schooljaar waren er flink wat studenten die het onderdeel statistiek niet met een voldoende hadden afgesloten. Mijn baas, Marcel Croon, die nog steeds in Tilburg werkt, inmiddels als universitair hoofddocent, maakte zich dáár geen zorgen over. Hij was juist bang dat hij de toetsen te gemakkelijk had gemaakt omdat er geen enkele student was die alléén op statistiek gezakt was. Iedereen die voor statistiek gezakt was had ook op tenminste een van de andere drie vakken een onvoldoende gehaald. Ik zei hem dat het ook aan de kwaliteit van het onderwijs kon liggen! Ik had van heel wat mede-studenten gehoord dat ze echt goede uitleg van hem kregen (en ook een klein beetje van mij). Als docent statistiek hoefde ik dat natuurlijk niet aan hem uit te leggen maar de man had gewoon last van zijn 'fatsoenlijke' opvoeding: hij had er moeite mee om zijn eigen goede onderwijsprestaties als vanzelfsprekend te beschouwen.
Ook op een andere manier bleek zijn fatsoen: hij ging niet suggereren dat ik misschien 'omgekocht' was en de schrapkaarten die mijn jaargenoten invulden bij de toetsen had verbeterd alvorens ze aan de computer te voeren. (Van computers hacken had in die tijd nog nooit iemand gehoord).
 
Voor eventuele middelbare scholieren onder de lezers: controleer mijn berekeningen uit het stukje naast de eerste afbeelding!

Frans Groenendijk,  07-06-2011          

Reacties
# 1
roel:

Het gaat om dat opzettelijk liegen. Zo is er een wethouder in Amsterdam die in de krant laat zetten dat de bevolking in hoog tempo weer 'blank' wordt. Zo wordt er ook enorm gesjoemeld met criminaliteitscijfers. De meest gebruikte truc om de cijfers te vervalsen is door de definitie aan te passen. Als bijvoorbeeld onder de noemer 'allochtonen' alleen mensen vallen die vanuit een niet-Westers land niet langer dan vijf jaar geleden Nederland binnenkwamen dan krijg je heel andere resultaten. Vele wetenschappers doen aan dit soort vervalsing om tot politiek correcte resultaten te komen.

07-jun 2011 ,  03:23
# 2
Jaap:

Met name onderzoeksrapporten uit de hoek van de sociale wetenschappen grossieren in statistische zinsbegoogeling. Probleem is vaak dat de aldus onderbouwde 'conclusies' nog dezelfde avond op alle journaals herhaald worden, terwijl de ontmaskering beperkt blijft tot zeer kleine kring.

07-jun 2011 ,  09:13
# 3
Frans Groenendijk:

Precies Jaap en Roel. En dat is een van de zaken die de stichting 'De verontruste kleermaker' i.o. gericht gaat aanpakken.

07-jun 2011 ,  09:18
Reageren is niet mogelijk op dit bericht.