Antwoord bij rekenopgave 3.7

a. Bij het gebruiken van een leugendetector wordt de te testen persoon geacht de waarheid te spreken (H0) totdat "bewezen" is dat hij liegt (H1). Wat is in deze context een fout van de eerste soort? En een fout van de tweede soort?

Fout van de eerste soort: de nulhypothese verwerpen wanneer die wel waar is. Hier is dit dus dat je van personen die niet liegen (H0) onterecht aanneemt dat zij wel liegen.
Fout van de tweede soort: de nulhypothese niet verwerpen wanneer die onjuist is. Hier gaat het om mensen die wel liegen (H1), terwijl we concluderen dat zij niet liegen.

b. Wat is volgens het onderzoek (bij benadering) de kans dat een test met een leugendetector resulteert in een fout van de eerste soort? En een fout van de tweede soort?

Bij de 500 personen die niet liegen, neemt de leugendetector 185 keer de verkeerde beslissing dat zij wel liegen. Dit is een kans van (185 / 500) * 100% = 37 %.
Bij de 500 personen die wel liegen, neemt de leugendetector 120 keer de verkeerde beslissing dat zij niet liegen. Dit is een kans van (120 / 500) * 100% = 24 %.
Het gaat hier overigens om een benadering van de foutkansen omdat er gewerkt wordt met een steekproef zonder dat we rekening houden met de steekproevenverdeling en de kans dat een volgende steekproef hetzelfde resultaat zal opleveren.

c. Wanneer we mogen aannemen dat de 1000 personen een aselecte steekproef zijn, geeft de leugendetector dan een significant ander percentage leugenaars dan het percentage leugenaars in de populatie waaruit de steekproef is getrokken (50%)?

We toetsen hier een steekproefproportie. Dat mogen we met de standaardnormale verdeling doen wanneer N ∙ π0 > 5 en N ∙ (1 - π0) > 5. Hier komt dit uit op respectievelijk N ∙ π0 = 1000 ∙ 0,5 = 500 en N ∙ (1 - π0) = 1000 ∙ (1 - 0,5) = 500. We kunnen dus de standaardnormale verdeling gebruiken om de volgende hypothesen te toetsen:
H0: π = 0,5.
H1: π ≠ 0,5.
De proportie leugenaars in de populatie is gegeven: 50% oftewel 0,50. De proportie leugenaars in de steekproef moeten we uitrekenen op grond van de informatie die we hebben. De leugendetector geeft bij de 500 proefpersonen die de waarheid spreken, aan dat er 185 leugenaars zijn. Van de 500 leugenaars worden er 120 aangezien als mensen die de waarheid spreken dus er blijven 380 proefpersonen die als leugenaar zijn aangemerkt. In totaal 'ziet' de leugendetector dus 185 + 380 = 565 leugenaars onder de 1000 proefpersonen. Dat is een proportie p = 0,565.
We kunnen de formule nu invullen:

NB je moet hier met meer dan 3 decimalen werken om een uitkomst te krijgen aangezien het getal onder het wortelteken erg klein wordt. Beter nog is het om tussendoor niet af te ronden. Dan kom je uit op een z-waarde rond 4,11.

De rechter overschrijdingskans van z = 4,06 is heel erg klein; de hoogste z-waarde in de significantietabel is 4,0 met een overschrijdingskans van 0,00003. De tweezijdige overschrijdingskans is het dubbele van de eenzijdige overschrijdingskans, maar die blijft ook heel erg klein. Ook wanneer we naar de kritieke waarde van z kijken (1,96 bij een tweezijdig significantieniveau van 5%), is het duidelijk dat de gevonden z-waarde (hoogst) significant is.
We verwerpen dus de nulhypothese dat de leugendetector 50% van de mensen als leugenaar aanwijst. De leugendetector blijkt meer mensen als leugenaars aan te merken.