Antwoord bij rekenopgave 3.4

a. Vul deze tabellen verder in.

Hier is een t-toets op één gemiddelde uitgevoerd. We moeten de bijbehorende formules gebruiken om de standaardfout, t-waarde, etcetera uit te rekenen.

De standaardfout van het steekproefgemiddelde (Std. Error Mean) kunnen we afleiden uit de formule voor t:

De standaardfout kunnen we invullen in de formule voor t. In de teller van deze formule zien we het gemiddelde verschil (Mean Difference), namelijk het verschil tussen het steekproefgemiddelde (M = 110) en het gemiddelde dat we volgens de nulhypothese verwachten (μ0 = 100).

Het aantal vrijheidsgraden is eenvoudig te bepalen: N - 1 = 121 - 1 = 120.

Tenslotte moeten we het betrouwbaarheidsinterval nog berekenen, waarvoor we weer de standaardfout gebruiken. Bovendien moeten we de kritieke t-waarde hebben voor 95% betrouwbaarheid (dus 5% significantieniveau) bij 120 vrijheidsgraden: t (120) = 1,980.

De ingevulde tabellen:
One-Sample Statistics

N Mean Std. Deviation Std. Error Mean
Exposure 121 110,000 60,000 5,455
One-Sample Test

Test Value = 100
t df Sig. (2-tailed) Mean Difference 95% Confidence Interval
        Lower Upper
Exposure 1,833 120 0,069 10 99,199 120,801

NB SPSS vermeldt helaas niet het betrouwbaarheidsinterval van het populatiegemiddelde maar het betrouwbaarheidsinterval van het verschil tussen het steekproefgemiddelde en het populatiegemiddelde volgens de nulhypothese (Test Value). Wanneer je dit laatste betrouwbaarheidsinterval zou willen uitrekenen, moet je het populatiegemiddelde volgens de nulhypothese (Test Value) aftrekken van het betrouwbaarheidsinterval van het populatiegemiddelde. Je krijgt dan als ondergrens 99,199 - 100 = -0,801 en als bovengrens 120,801 - 100 = 20,801. Het verschil ligt dus met 95% zekerheid tussen -0,801 en 20,801. Het gevonden verschil is 10; dat ligt in het midden van het betrouwbaarheidsinterval, zoals dat hoort.

b. Kan het ware gemiddelde (populatiegemiddelde) 100 zijn in plaats van groter dan 100 met een significantieniveau van 5%? Pas zowel de t-toets als de z-toets toe. Interpreteer en vergelijk de resultaten van deze toetsen.

Volg de stappen bij het toetsen.


De t- en de z-toets geven dezelfde conclusie. Dat is altijd zo bij grote steekproeven (N ≥ 100), vandaar dat je formeel bij grote steekproeven de z-toets mag gebruiken ondanks dat je de standaardafwijking van d epopulatie niet kent.

c. Kan de steekproef getrokken zijn uit een populatie met gemiddelde 100 in plaats van een hoger of lager gemiddelde? Hanteer een significantieniveau van 5%. Pas zowel de t-toets als de z-toets toe. Interpreteer en vergelijk de resultaten van deze toetsen.

Vertaal de opgave in een toets: de nulhypothese is dat het populatiegemiddelde (μ) 100 is: μ = 100. De alternatieve hypothese is nu tweezijdig: het populatiegemiddelde kan hoger of lager dan 100 zijn: μ ≠ 100. Weer geldt α = 0,05.

De t-toets.
We doen nu een tweezijdige toets dus kunnen we de door SPSS gerapporteerde overschrijdingskans (0,069) direct vergelijken met het significantieniveau (0,05). De overschrijdingskans is groter dan het significantieniveau dus we handhaven de nulhypothese dat het populatiegemiddelde 100 kan zijn.

De z-toets.
De kritieke z-waarde voor een tweezijdige toets met 5% significantieniveau is volgens het formuleblad 1,96. Het verwerpingsgebied bevat nu dus alle z-waarden onder -1,96 en alle z-waarden boven 1,96.
Je hoeft geen nieuwe z-waarde te berekenen voor de steekproef: die blijft hetzelfde als in opgave a. Je kunt dus direct een conclusie trekken.
De berekende z-waarde (1,833) ligt niet in het verwerpingsgebied, dus is de toets niet statistisch significant. We verwerpen de nulhypothese niet en gaan er (vooralsnog) van uit dat het populatiegemiddelde 100 is of kan zijn.
Conclusie: "Het gemiddelde in de steekproef (M = 110, SD = 60) wijkt niet significant af van 100, t (120) = 1,833 OF z = 1,833; p = 0,068."

Weer leiden beide toetsen tot dezelfde conclusie.

d. Vergelijk de resultaten van de toetsen bij b met die bij c. Leg uit waarom de resultaten verschillend zijn.

Bij de eenzijdige toets vinden we een significant resultaat, bij de tweezijdige toets niet. De reden is dat we bij een eenzijdige toets het hele risico (significantieniveau) dat we de nulhypothese ten onrechte verwerpen, aan één kant van het veronderstelde populatiegemiddelde leggen. We gaan er bij voorbaat van uit dat het ware gemiddelde nooit lager kan zijn dan 100. We kijken alleen maar naar hogere gemiddelden, die we eerder 'uitzonderlijk' of wel heel toevallig vinden wanneer de nulhypothese waar zou zijn. Zie onderstaande afbeelding (kritiek gebied = verwerpingsgebied).