Toetsen op een of meer gemiddelden uitvoeren

In SPSS gebruiken we altijd een t-toets wanneer we een uitspraak over een of twee gemiddelden in de populatie (μ) willen toetsen. In het vak Inferentiële Statistiek zullen we daarom ook altijd met een t-toets werken. Zolang iedere steekproef meer dan 30 waarnemingen heeft of het is bekend dat de populatie normaal verdeeld is, mag de t-toets toegepast worden.
Bij een steekproef met maximaal 30 waarnemingen en een duidelijk niet normaal verdeelde populatie, moeten er eigenlijk alternatieve toetsen uitgevoerd worden, maar die worden alleen in het excellentie/honoursprogramma behandeld. Reguliere studenten voeren dan toch een t-toets uit, maar zij vermelden wel in de interpretatie dat aan de voorwaarden voor een t-toets waarschijnlijk niet voldaan is.

Bij een toets op één gemiddelde of op twee gemiddelden (onafhankelijke steekproeven) is het soms correcter om een z-toets uit te voeren. Voor de fijnproevers daarom onderstaand keuzeschema.
De keuze tussen een z-toets en een t-toets hangt af van:

de omvang van de steekproef (N) - wanneer je de gemiddelden van 2 groepen vergelijkt, heb je 2 steekproeven; elk van beide steekproeven (n₁ en n₂) moet dan aan de eisen voldoen,
of je de standaarddeviatie in de populatie (σ) weet,
en of de variabele waarvan het gemiddelde getoetst wordt in de populatie normaal verdeeld is.

Een keuzeschema:

Spreiding van de variabele in de populatie (σ)	Verdeling variabele in de populatie	Omvang steekproef (N)	Toets
bekend	normaal	n.v.t.	z-toets
n.v.t.	n.v.t.	≥ 100	z-toets
onbekend	normaal	< 100	t-toets
onbekend	niet normaal	30 < N < 100	t-toets
onbekend	niet normaal	N ≤ 30	een non-parametrische toets, permutatietoets of bootstrapping (alleen excellentie/honoursprogramma)

Er zijn toetsen voor een en voor twee gemiddelden:

Toets op één gemiddelde: wanneer je wilt nagaan of het steekproefgemiddelde significant verschilt van een vaste waarde, bijvoorbeeld een bekend populatiegemiddelde of een norm. De nulhypothese is dat het populatiegemiddelde gelijk is aan een getal dat de onderzoeker kiest(μ₀).
H₀: μ = μ₀
Bij een eenzijdige toets is de nulhypothese H₀: μ ≥ μ₀ of H₀: μ ≤ μ₀.
Dit is een voorbeeld van univariaat beantwoorden van een onderzoeksvraag: je hebt een vraag over één gemiddelde, bijvoorbeeld of de gemiddelde leeftijd van een steekproef van Nederlanders afwijkt van de gemiddelde leeftijd van alle Nederlanders (die we dankzij het CBS kennen).
Toets voor het verschil tussen twee gemiddelden: wanneer je wilt nagaan of de ene groep eenheden (respondenten) dezelfde gemiddelde score op een variabele heeft als een andere groep eenheden. De nulhypothese is dat de gemiddelden hetzelfde zijn:
H₀: μ₁ = μ₂ of H₀: μ₁ - μ₂ = 0
Bij een eenzijdige toets is de nulhypothese H₀: μ₁ ≥ μ₂ of H₀: μ₁ ≤ μ₂.
Deze toets gebruik je wanneer je groepen respondenten wilt vergelijken op één kenmerk, bijvoorbeeld of de attitude ten aanzien van gezondheidsrisico's bij vrouwen anders is dan bij mannen.
Dit is een voorbeeld van bivariaat beantwoorden van een onderzoeksvraag. De kwantitatieve variabele is de ene (doorgaans afhankelijke) variabele en het kenmerk waarop de twee groepen worden gevormd, is de andere (doorgaans onafhankelijke) variabele.
Er zijn twee versies van deze toets: één voor de situatie dat de variantie van de afhankelijke variabele in de populatie voor de ene groep hetzelfde is als voor de andere groep, en een versie waarbij dit niet het geval is. Om te bepalen of je mag uitgaan van gelijke varianties in de populatie, moet je een aparte toets uitvoeren: Levene's F-toets in SPSS en de F-toets op twee varianties bij handmatige berekening.
Toets gepaarde waarnemingen: wanneer je wilt nagaan of de gemiddelde score op het ene moment afwijkt van de gemiddelde score op het andere moment. De nulhypothese is dat het gemiddelde verschil (μ_v) nul is, dus dat de metingen gemiddelde hetzelfde zijn:
H₀: μ_v = 0
Bij een eenzijdige toets is de nulhypothese H₀: μ_v ≥ 0 of H₀: μ_v ≤ 0.
Deze toets wordt bijvoorbeeld gebruikt bij een voor- en nameting: is de (gemiddelde) attitude ten aanzien van gezondheidsrisico's na het zien van een voorlichtingsfilm veranderd?
Dit is een voorbeeld van bivariaat beantwoorden van een onderzoeksvraag omdat je twee kwantitatieve variabelen analyseert. In een (quasi) experimentele opzet zijn de twee kwantitatieve variabelen doorgaans de afhankelijke variabelen.

Voordat je een uni- of bivariate onderzoeksvraag kunt beantwoorden, moet je alle relevante voorgaande uni- en bivariate stappen hebben gezet. Dat zijn bij de toetsen op een of meer gemiddelden:

Univariaat beschrijven: zeer aan te raden om fouten in de data op te sporen.
Univariaat bewerken: fouten, missing values, selectie van relevante cases en dergelijke moeten gecorrigeerd worden.
Univariaat beoordelen: controleren of de verdeling van de variabele normaal kan zijn in de populatie. Zie de hint Controle op normale verdeling.
NB dit is alleen nodig wanneer je een t-toets uitvoert op een steekproef met 30 of minder waarnemingen. Deze regel geldt voor elke steekproef (groep) afzonderlijk. Bij grotere steekproeven mag de t-toets ook uitgevoerd worden wanneer de variabele in de populatie niet normaal verdeeld is.
Wanneer een t-toets op twee gemiddelden wordt uitgevoerd, moet er nog gekozen worden uit twee situaties: mogen we ervan uitgaan dat de varianties of standaarddeviaties in de populatie gelijk zijn of niet?
We moeten dus eerst de nulhypothese toetsen of de twee groepen dezelfde variantie hebben op de kwantitatieve variabele in de populatie H₀: σ₁² = σ₂². Dit kan met een F-toets.