Antwoord bij rekenopgave 3.4e

Toelichting: De waarde in populatie 1 kan bijvoorbeeld de voormeting zijn en de waarde in populatie 2 kan de nameting zijn. Paar 1 is dan de eerste proefpersoon, die bij de voormeting 28 scoort en bij de nameting 22. Dit illustreert dat in de inferentiële statistiek het begrip populatie niet staat voor een verzameling onderzoekseenheden (proefpersonen), maar voor een verzameling metingen (voormeting, nameting).

a. Toets de nulhypothese H0: μv = 0 tegen H1: μv ≠ 0, waar μv = μ1 - μ2. Gebruik α = 0,05.

Leer jezelf aan om alle stappen in de vaste volgorde uit te voeren:

Stap 1: Stel de hypothesen op. Die zijn al gegeven in de opgave. Het is duidelijk dat het om een tweezijdige toets gaat.

Stap 2: Kies de kansverdeling en de toets. We kunnen de toetsingsgrootheid t gebruiken omdat we met (maximaal twee) gemiddelden werken. Voor gepaarde waarnemingen hebben we bovendien geen z-toets, dus keuze hebben we niet.

Stap 3: Bepaal de kritieke waarde en het verwerpingsgebied. Zoek de kritieke waarde van t op, d.w.z. de waarde waarboven (of waaronder) de nulhypothese verworpen wordt. De kritieke waarde van t bij 5 - 1 = 4 vrijheidsgraden bij een tweezijdig significantieniveau van 5% is 2,776. Het verwerpingsgebied bij een tweezijdige toets is dan alle t-waarden kleiner dan -2,776 of groter dan 2,776.

Stap 4: Bereken nu de t-waarde voor deze steekproef. De formule voor t bij afhankelijke (gepaarde) scores:


met df = N - 1 .

Eerst moeten we de verschilscore (v) berekenen en het kwadraat hiervan. Hiermee kunnen we de standaarddeviatie van de verschilscore (sv) berekenen, die we nodig hebben voor de standaardfout.

Hulptabel:
Paar Waarde in populatie 1 (x1) Waarde in populatie 2 (x2) v v2
1 28 22 6 36
2 31 27 4 16
3 24 20 4 16
4 30 27 3 9
5 22 20 2 4
som     19 81
som2     361  
gemiddelde     19/5 = 3,8  

Vul de rekenformule voor de populatieschatting van de standaarddeviatie nu in met de verschilscore (v) op de plaats van de variabele (xi):

Nu kunnen we de formule voor t invullen:

Stap 5: Ga na of de berekende t-waarde in het verwerpingsgebied valt en trek een conclusie: De gevonden t-waarde (5,73) is groter dan de kritieke waarde (2,776) dus is het resultaat statistisch significant en verwerpen we de nulhypothese dat het verschil van de populatiegemiddelden (μv) 0 is. We accepteren (voorlopig) de alternatieve hypothese dat er een verschil is tussen de gemiddelden van de twee populaties.

Conclusie: "De score in populatie 1 (M = 27,0, SD = 3,87) is hoger dan in populatie 2 (M = 23,2, SD = 3,56). Dit is een statistisch significant verschil, t (4) = 5,73, p < 0,05, d = 2,56. Tevens is dit verschil uitermate relevant, het effect is zeer groot."
De gemiddelden en standaarddeviaties moeten apart uitgerekend worden om ze in deze conclusie te kunnen vermelden.
NB wanneer het om een voor- en nameting zou gaan, concluderen we dus dat de gemiddeld 3,8 hogere score op de voormeting (dan op de nameting) significant is op het 5%-niveau. We mogen er vooralsnog van uitgaan dat de behandeling tussen de voor- en nameting de score verlaagt.

b. Construeer een 95% betrouwbaarheidsinterval voor μv.

Voor het 95% betrouwbaarheidsinterval moeten we de kritieke t-waarde invullen die hoort bij N - 1 = 4 vrijheidsgraden en een tweezijdige significantie van 5%. Dit is dus de t-waarde die we bij a ook hebben gebruikt: tkrit = 2,776.
De standaarddeviatie van de verschilscore hebben we bij a al uitgerekend: SDx1 - x2 = 1,483. We kunnen de formule dus direct invullen:

Het 95% betrouwbaarheidsinterval is dus 95% CI [1,96, 5,64]. Met 95% zekerheid ligt het verschil tussen de gemiddelden van beide populaties tussen de 1,96 en 5,64. Een gemiddeld verschil van 0 in de populaties sluiten we met 95% zekerheid uit aangezien 0 niet in het betrouwbaarheidsinterval ligt.
N.B. is de standaardfout van het gemiddelde verschil, die de noemer vormt van de formule voor t. We hadden deze waarde (hier: 0,663) dus ook direct in kunnen vullen in de formule voor het betrouwbaarheidsinterval.

c. Wanneer zijn de procedures die je in a en b hebt gebruikt geldig?

Voor elke statistische toets wordt geëist dat de steekproeven aselect getrokken worden. Dat is hier het geval.
Voor een t-toets heb je interval- of ratio meetniveau nodig; dat lijkt hier het geval te zijn.
Voor t-toetsen op steekproeven met 30 of minder waarnemingen moeten de variabelen in de populatie normaal verdeeld zijn. Daarover hebben we geen informatie; we moeten dit dus aannemen om een t-toets te mogen uitvoeren en een betrouwbaarheidsinterval uit te rekenen.