Antwoord bij rekenopgave 2.8

Volgens cijfers van het CBS was de gemiddelde omvang van de banen bij omroeporganisaties in Nederland in 2005 0,7 fte (full-time equivalent). Laten we aannemen dat de standaarddeviatie van de omvang van deze banen 0,3 is en dat dit normaal verdeeld is.

a. Wanneer we een aselecte steekproef van 36 omroepmedewerkers trekken, wat is dan de verwachte waarde voor het steekproefgemiddelde?

De verwachte waarde voor het steekproefgemiddelde is gelijk aan het populatiegemiddelde, dus verwachten we een steekproefgemiddelde van 0,7 fte.

b. Wanneer we 100 aselecte steekproeven van 36 omroepmedewerkers trekken, wat is dan de verwachte waarde voor het gemiddelde van de steekproefgemiddelden?

Wanneer we voor elke steekproef het populatiegemiddelde als steekproefgemiddelde verwachten, zal het gemiddelde van de verwachte steekproefgemiddelden ook het populatiegemiddelde zijn. Kortom, de verwachting van het gemiddelde steekproefgemiddelde is ook 0,7 fte.
Omdat het steekproefgemiddelde een zuivere schatter is van het populatiegemiddelde, mogen we ervan uitgaan dat hoe meer steekproeven we trekken uit dezelfde populatie, hoe meer het gemiddelde van de steekproefgemiddelden zal lijken op het populatiegemiddelde.

c. Wat is de verwachte standaardafwijking van de gemiddelde omvang van de banen in de steekproevenverdeling in een aselecte steekproeven van 36 omroepmedewerkers?

De standaardafwijking van een kansvariabele (hier: het steekproefgemiddelde) in de steekproevenverdeling heet de standaardfout. De formule voor de standaardfout die onder 'Kansverdelingen en z-score' staat op het formuleblad kunnen we invullen en uitrekenen omdat de standaarddeviatie van de variabele 'omvang baan'in de populatie gegeven is in de opgave: σ = 0,3. De standaardfout blijkt 0,05 te zijn.

d. Wanneer we 100 aselecte steekproeven van 36 omroepmedewerkers trekken, hoeveel steekproeven hebben dan een gemiddelde baanomvang boven 0,7 fte? Hoeveel hebben een gemiddelde dat meer dan 1 standaardfout boven 0,7 fte ligt? En hoeveel hebben een gemiddelde dat boven 0,8 fte ligt?

De steekproevenverdeling geeft aan hoe groot de kans is dat je een steekproef trekt waarin het gemiddelde boven een bepaalde grens ligt. Wanneer de variabele in de populatie normaal verdeeld is, mogen we ervan uitgaan dat de steekproevenverdeling ook normaal verdeeld is (het omgekeerde geldt niet altijd). Dan kunnen we via z-scores kansen opzoeken bij grenzen.
De normaalverdeling is symmetrisch, dus de kans op een steekproefgemiddelde boven het populatiegemiddelde is gelijk aan de kans op een steekproefgemiddelde onder het populatiegemiddelde. Die kansen zijn samen 1, dus is de kans op een steekproefgemiddelde boven 0,7 fte gelijk aan 50%. 50 van de 100 steekproeven zal een gemiddelde baanomvang hebben boven 0,7 fte.
Als je het wilt narekenen, moet je de z-score uitrekenen van het steekproefgemiddelde wanneer dit 0,7 is. Ga verder uit van het echte populatiegemiddelde (we weten dit gemiddelde dus we hoeven er geen nulhypothese over op te stellen) en de bij c berekende standaardfout van het steekproefgemiddelde.
Let op: je rekent nu geen z-score uit voor de waarde op een gewone variabele, maar voor de waarde van een steekproefgemiddelde.

De z-score is dus (zoals verwacht) 0 oftewel het midden van de normaalverdeling. In de significantietabel voor de standaardnormale verdeling staat een rechter overschrijdingskans van 0,5. NB het maakt niet uit of je de kans boven 0 of de kans op 0 of hoger neemt aangezien de kans op precies 0 verwaarloosbaar klein is.

Wanneer je één standaardfout boven het gemiddelde zit, is de z-score van het steekproefgemiddelde per definitie 1. Let op: een standaarddeviatie boven het gemiddelde levert hier een z-score van 1 op voor de omvang van de baan van één omroepmedewerker, terwijl één standaardfout boven het gemiddelde een z-score van 1 oplevert voor het steekproefgemiddelde.
In de significantietabel kun je dus direct opzoeken wat de rechter overschrijdingskans is bij z = 1, dit is 0,159. Afgerond 16 van de 100 steekproeven zal een steekproefgemiddelde hebben dat minstens 1 standaardfout (0,05) boven 0,7 fte ligt.
Als je het wilt narekenen, kun je voor X de som van het populatiegemiddelde (0,7) en de standaardfout (0,05) invullen in de formule voor z.

Om de kans op een steekproefgemiddelde boven 0,80 fte te vinden, kun je het beste eerst de z-score voor een steekproefgemiddelde van 0,8 fte uitrekenen.

De z-score blijkt 2,000 te zijn. De rechter overschrijdingskans is dan volgens de tabel 0,023. We verwachten dat maar 2 (of 3) van de 100 steekproeven een gemiddelde baanomvang boven 0,8 fte zal hebben.