Lunch good science bad science
Stel je bent op reis geweest naar Indonesië en wil je graag laten testen op malaria omdat je je al een tijdje niet lekker voelt. De dokter vertelt dat hij een test heeft die voor 99% betrouwbaar is, dat wil zeggen dat de test bij 99 procent van de mensen die aan deze ziekte lijdt een positieve uitslag geeft en bij 99 procent van de mensen die niet aan deze ziekte lijdt een negatieve uitslag geeft. Dit lijkt een goede test en zonder daar veel over na te denken laat je deze test uitvoeren. We zullen echter zien dat hoe vaak een ziekte voorkomt een grote invloed heeft op de betrouwbaarheid van een test.
Laten we nu aannemen dat 1 op de 10.000 mensen malaria heeft en dat iedereen op aarde even veel kans heeft om ziek te zijn. Wat is nu de kans dat wanneer de test een positieve uitslag geeft je ook daadwerkelijk ziek bent? Dus dat de test je vertelt dat je ziek bent en je malaria hebt. Stel nu dat een willekeurige groep van 1 miljoen mensen zich laat testen. Het aantal mensen dat naar verwachting ziek is 1.000.000/10.000 = 100 mensen. De test, die voor 99% betrouwbaar is, zal dan bij 1 persoon een negatieve uitslag geven en bij 99 personen een positieve uitslag. 999.900 mensen zijn niet ziek. De test geeft bij deze mensen die geen malaria hebben in 1 procent van de gevallen een positieve (dus wel ziek) uitkomst. Dat is bij 0,01*999900=9999 mensen het geval. Het aantal mensen dat in totaal positief getest wordt is 9999+99=10.098. Slechts 99 mensen van die 10.098 positief geteste mensen hebben de ziekte ook daadwerkelijk. De kans dat de test een positieve uitslag geeft en je de ziekte ook hebt is, 99/10.098=0,0098=0,98%, dus minder dan 1 procent!
De ogenschijnlijke betrouwbaarheid van 99 procent blijkt helemaal niet te kloppen. De onbetrouwbaarheid zit hem in het feit dat de kans dat iemand de ziekte heeft erg klein is. Daardoor blijft een grote groep mensen over die de ziekte niet heeft. 1 procent van een grote groep is dan nog steeds een groot getal. Hoe zeldzamer de ziekte is, hoe meer betrouwbaar je test moet zijn.
Ontdek in de lezing van Jos Uffink de bedrieglijkheid van statistiek.