Kun betinget logisk

Mennesket er ikke skabt til at regne med sandsynligheder. Et par eksempler fortæller hvorfor


Af Robin Engelhardt

Forestil dig at du skal købe to gaver med hjem fra ferien for at glæde din kollegas to børn. Mens du leder efter nogle gode ting i legetøjsbutikken, kommer du i tanker om, at du ikke kan huske, om de to børn begge er drenge, eller om de er en dreng og en pige. En pinlig situation. Du kan godt huske at én af dem var en dreng, men den anden?

Spørgsmålet er derfor: Vil du nu købe to drengegaver eller vil du købe en drenge- og en pigegave? Du kunne forsøge at tænke i sandsynligheder (du har måske en matematisk studentereksamen), og formulerer spørgsmålet på en mere matematisk måde: Hvad er sandsynligheden for at din kollegas to børn er drenge, når du ved at den ene er en dreng?

Det er måske overraskende, men spørgsmålet er slet ikke så trivielt som man umiddelbart måtte tro. Selv matematisk trænede mennesker har ofte forskellige svar: Er det 1/2 eller 1/3?

Lad os komme med svaret med det samme: Hvis vi betegner »ingen sandsynlighed overhovedet« med 0 og »absolut sikkert« med 1, er det rigtige svar for at kollegaen har to drenge »en tredjedel«.

Måske tænker man, at fødslen af børn er statistisk uafhængige hændelser, og at det derfor er ligegyldigt at vide, om det ene barn er en dreng: Sandsynligheden for at få en dreng til er (mere eller mindre) 50 procent og dermed basta.

Men det er helt forkert. Spørgsmålet var betinget af, at der er to børn, og at det ene var en dreng. For at finde det rigtige svar må man adskille sin viden om a priori sandsynligheder (at en dreng bliver født cirka hver anden gang) med de betingede sandsynligheder, der ofte resulterer i intuitivt ganske ulogiske svar. For at følge ræsonnementet skal man spørge sig selv følgende ting:
  1) Hvad er a priori sandsynligheden for, at et ægtepar med to børn har to drenge? Svar: 1/4.
  2) Hvad er sandsynligheden for, at én af dem er en dreng (D)? Svar: 3/4, fordi de fire muligheder er DD, DP, PD og PP (idet vi ikke ved hvem af børnene er en dreng, og hvem en pige, er DP og PD to forskellige situationer). For at få det rigtige svar på det oprindelige spørgsmål, må man derfor dividere 1/4 med 3/4, hvilket giver 1/3.

Thomas Bayes
Det var oprindeligt den engelske kirkefader Thomas Bayes, der i midten af 1700-tallet formulerede de sandsynlighedsteoretiske rammer og teoremer til grund for den slags beregninger, men til trods for flere hundrede års kendskab til dem, er betingede sandsynligheder stadig notorisk svære at kapere og basis for mange diskussioner.

Der er mange eksempler på øjensynlige paradokser, som kun trænede eksperter kan gennemskue. Blandt de mere berømte er det såkaldte Monty Hall paradoks: Navnet stammer fra et quiz-show i USA, hvor studieværten Monty Hall stiller vinderen overfor følgende afsluttende problem: Bag én af tre døre står der en cadilac, fri til afhentning, mens der bag de to andre står en sur ged.

Udfordringen er så at gætte på en dør og vinde cadilacen. En ged giver ikke noget. Men legen er ikke slut: Efter at gæsten har gættet på ­ lad os sige dør nummer ét ­ går Monty Hall til en af de andre to døre for at åbne en ged. Han åbner altid for en ged, og derefter spørger han: »Vil du vælge om?«

Ja, ville du vælge om? Du har endnu ikke set indholdet af din først valgte dør.

Det må være klart at du oprindeligt havde en tredjedel chance for at vinde bilen, og at den nu er steget (til 50 procent?), idet Monty Hall har udelukket en af dørene. Men skulle det hjælpe at vælge den anden dør nu? Det er spørgsmålet.

Svaret er, at det er en rigtig god idé at vælge om. Faktisk øges sandsynligheden til det dobbelte, og for at finde svaret (2/3) må man ræsonnere på en lignende måde som før (man kan også besøge internetadressen www.hofstra.edu/~matsrc/MontyHall/MontyHall.html for at afprøve sagen i praksis).

Armstrong på dope?
Et måske mere aktuelt eksempel er spørgsmålet om doping i cykelsporten.

Det er faktisk et kompliceret emne. Den blotte viden om, at en dopingtest kan afsløre brugen af f.eks. EPO (hvilket faktisk er en test, der findes, men ikke bruges), er ikke nok til at afgøre noget som helst.

Hvis vi forestiller os, at en læge siger, at han kan afsløre brugen af EPO med 95 % sikkerhed, og Armstrong lige er blevet testet positiv med den test ­ hvad er sandsynligheden for, at han bruger EPO? Mere korrekt formuleret: Hvad er sandsynligheden for, at Armstrong har brugt EPO, givet at han er blevet testet positiv?

Nej, den er ikke 95 %, for vi mangler den information, der fortæller os hvad risikoen for en falsk positiv test er, og vi mangler også den information, der fortæller os med hvor stor sandsynlighed Armstrong faktisk har taget stoffet a priori. Læger glemmer ofte at fortælle risikoen for en falsk positiv test: Lad os antage at den er 15%. Derefter må vi vide hvad sandsynligheden er, for at en rytter i Tour de France tager EPO (vi kan jo ikke bare postulere at alle tager EPO, for så ville en test jo være unødvendig). Lad os være flinke og sige, at sandsynligheden er 10%.

Lidt mellemregning fortæller, at sandsynligheden for at en rytter tager EPO, og bliver testet positiv for det, er 9,5%, mens sandsynligheden for at en rytter ikke tager EPO, men alligevel bliver testet positiv, er 13,5%.

For at finde løsningen på det oprindelige spørgsmål, skal det første tal divideres med summen af dem begge, hvilket giver en sandsynlighed på cirka 41% for at Armstrong faktisk brugte EPO da han blev testet.

Næppe et resultat, der vil holde i retten.

0 comments:

There was an error in this gadget