Stap 1: stel de hypothesen op.
H0 : μmannelijke personages ≥ μvrouwelijke personages
H1 : μmannelijke personages < μvrouwelijke personages
Het is een eenzijdige toets.
Stap 2: Kies de kansverdeling en de toets.
We mogen de toetsingsgrootheid t gebruiken omdat we ervan mogen uitgaan dat de variabele 'lachfrequentie' in de populatie normaal verdeeld is, ook al zijn de steekproeven kleiner dan 30.
Stap 3: Bepaal de kritieke waarde en het kritieke gebied. Zoek de kritieke waarde van t op, d.w.z. de waarde waarboven de nulhypothese verworpen wordt.
We hebben hier onafhankelijke scores: een personage is mannelijk of vrouwelijk. We hadden een aparte steekproef van mannelijke personages kunnen trekken en een aparte steekproef van vrouwelijke personages.
Om de vrijheidsgraden te bepalen moeten we weten of we mogen uitgaan van gelijke varianties in de populatie. Hiervoor moeten we eerst een F-toets uitvoeren, die hier toegestaan is aangezien gegeven is dat de variabele normaal verdeeld is in de populatie. Dit is een toetsprocedure op zichzelf met de 5 vaste stappen:
Personages | Aantal keer lachen (xi) | xi2 |
Mannelijk | 8 | 64 |
11 | 121 | |
13 | 169 | |
4 | 16 | |
2 | 4 | |
Som | 38 | 374 |
Gemiddelde | 7,6 | |
Som2 | 1444 | |
Vrouwelijk | 15 | 225 |
9 | 81 | |
13 | 169 | |
11 | 121 | |
18 | 324 | |
Som | 66 | 920 |
Gemiddelde | 13,2 | |
Som2 | 4356 |
Stap 4: Bereken nu de t-waarde voor deze steekproef.
De varianties in de twee steekproeven die we nodig hebben om de gepoolde variantie te schatten, hebben we al voor de F-toets uitgerekend. We kunnen de geppolde variantie dus uitrekenen:
en dit invullen in de formule voor de standaardfout (SE):
om tenslotte de formule voor t in te vullen:
Stap 5: Trek een conclusie: De gevonden t-waarde (-2,16) is kleiner dan de kritieke waarde (-1,86) dus ligt de gevonden t-waarde in het kritieke gebied. Het resultaat is statistisch significant en we verwerpen de nulhypothese.
Conclusie: "Vooralsnog gaan we ervan uit dat er wel een verschil is tussen de mannelijke en vrouwelijke personages in de populatie van al deze personages. Het gemiddeld aantal keren lachen ligt bij de vrouwelijke personages (M = 13,2, SD = 3,49) hoger dan bij mannelijke personages (M = 7,6, SD = 4,62) in de steekproef. Dit verschil is statistisch significant en relevant - t (8) = -2,16, p < 0,05, eenzijdige toets, d = 1,37 - en mag daarom gegeneraliseerd worden naar alle personages in de soap opera's." De berekening voor de effectgrootte vind je hieronder (met voor de volledigheid nogmaals de berekening voor de gepoolde variantie):
en
NB de standaarddeviaties zijn verkregen door de wortel te nemen van de varianties.