Antwoord bij rekenopgave 3.1

a. Bepaal een 95% betrouwbaarheidsinterval voor het populatiegemiddelde (μ).

De steekproef is kleiner dan 100 waarnemingen dus gebruiken we de t-verdeling om het betrouwbaarheidsinterval rond dit gemiddelde op te stellen. De formules:

met df = N - 1.

Gegeven is: het steekproefgemiddelde M is 26,2, de standaarddeviatie van de steekproef (s) is 4,1 en de steekproefomvang (N) is 70.
We kunnen dan het beste de rechter formule gebruiken. Dan hoeven we alleen de t-waarde op te zoeken. Daarvoor hebben we het aantal vrijheidsgraden nodig (de rijen in de significantietabel) en het significantieniveau. Het aantal vrijheidsgraden (df) is de steekproefomvang min 1, dus N - 1 = 70 - 1 = 69. Het significantieniveau is de 'onzekerheid', dus 100% min de 'zekerheid' die je wilt, dus 100% - 95% = 5%. Bij het betrouwbaarheidsinterval gebruiken we altijd tweezijdige significantie, dus kijken we in de kolom met 'tweezijdige toetsing' en '0,05'. De t-waarde is dan 1,995.

Nu kunnen we de formule invullen:
.

Het betrouwbaarheidsinterval loopt dus van 25,222 tot 27,178. We geven dit aan met [25,22, 27,18].

b. Interpreteer het berekende 95% betrouwbaarheidsinterval.

Met 95% zekerheid kunnen we zeggen dat het gemiddelde in de populatie (het ware gemiddelde) ligt tussen 25,22 en 27,18. Statistisch geformuleerd: in 95% van een oneindig aantal steekproeven (met N = 70) zal het ware gemiddelde (μ) in het betrouwbaarheidsinterval liggen.

c. Bepaal een 99% betrouwbaarheidsinterval voor μ.

Zie a. Het enige dat verandert is de t-waarde omdat we nu een betrouwbaarheid van 99% eisen. We kijken dan in de kolom met 'tweezijdige toetsing' en '0,01' en vinden t = 2,649. We hebben bij a al de standaardfout uitgerekend (de standaarddeviatie gedeeld door de wortel uit de omvang van de steekproef), die was 0,490. Dit kunnen we nu in de linker formule invullen:

.

Het betrouwbaarheidsinterval loopt dus van 24,902 tot 27,498. We geven dit aan met [24,90, 27,50].

d. Wat gebeurt er met de breedte van een betrouwbaarheidsinterval als de betrouwbaarheid wordt vergroot terwijl de steekproefomvang gelijk blijft?

95% betrouwbaarheidsinterval: [25,22, 27,18] en 99% betrouwbaarheidsinterval: [24,90, 27,50]. Als we meer zekerheid willen wordt het interval breder (de uitspraak over het ware gemiddelde is minder nauwkeurig). Dat is begrijpelijk: je sluit minder mogelijke uitkomsten voor het populatiegemiddelde uit wanneer je meer zekerheid wilt.

e. Wat is het 95% betrouwbaarheidsinterval voor het populatiegemiddelde (μ) wanneer bekend is dat de steekproef uit een normaal verdeelde populatie getrokken is met als standaardafwijking σ = 3,9? Leg uit waarom de uitkomst afwijkt van de uitkomst bij vraag a.

Nu we de standaardafwijking van de populatie weten en weten dat de populatieverdeling normaal is, mogen we de standaardnormaalverdeling gebruiken als kansverdeling waarin de kritieke waarde van z geldt. Voor 95% betrouwbaarheid hebben we de kritieke waarde nodig van α = 100 - 95% = 5% (tweezijdig!); die is 1,96. We kunnen nu de formule invullen:

.

Het betrouwbaarheidsinterval is iets smaller dan bij antwoord a, dus iets nauwkeuriger. Wanneer je de berekeningen van a en e vergelijkt, zie je dat dit komt omdat de kritieke z-waarde iets lager is dan de kritieke t-waarde (de standaardnormale verdeling is iets puntiger dan een t-verdeling) en omdat de werkelijke standaardafwijking in de populatie (3,9) iets lager is dan de geschatte standaardafwijking op grond van de steekproef (4,1). Deze twee lagere getallen zorgen ervoor dat er minder afgetrokken en opgeteld wordt bij het steekproefgemiddelde om aan het betrouwbaarheidsinterval te komen. Vandaar dat het interval smaller wordt.

Wanneer je erover nadenkt, is het eigenlijk raar dat je wel de standaardafwijking in de populatie weet, maar het populatiegemiddelde toch moet schatten. Om een standaardafwijking te berekenen moet je immers het gemiddelde weten.
Toch zijn er bijzondere situaties waarin dit het geval is. Wanneer je een meetschaal gebruikt die al heel veel gebruikt is, bijvoorbeeld een test om IQ te meten, kan het zijn dat uit eerder onderzoek bekend is dat de testscores normaal verdeeld zijn met een vrijwel vaste standaardafwijking, los van de gemiddelde score van een bepaalde (deel)populatie. Wanneer je dan een steekproef trekt, kun je de bekende standaardafwijking gebruiken ook al weet je het gemiddelde niet van de populatie waaruit de steekproef getrokken is.

De belangrijkste les uit deze deeloefening is dat het eigenlijk bar weinig uitmaakt of je een t- dan wel een z-verdeling gebruikt, althans wanneer je een steekproef van 70 waarnemingen trekt. De z-toets heeft dan weinig meerwaarde; daarom voert SPSS altijd een t-toets uit.