Stel dat het aantal verschillende kranten dat men leest als volgt verdeeld is onder alle Nederlanders: 45% leest geen krant, 35% leest 1 krant en 20% leest 2 kranten.
a. Wat is de verwachte waarde voor het gemiddelde van een steekproef met omvang N = 10? En wat is de verwachte waarde bij een steekproef met omvang N = 100?
Het aantal verschillende kranten dat een Nederlander leest is een numerieke variabele (ratio meetniveau). De formule voor de verwachting van het steekproefgemiddelde bij een numerieke variabele geeft aan dat het verwachte steekproefgemiddelde gelijk is aan het populatiegemiddelde:
Het populatiegemiddelde kunnen we uitrekenen op basis van de gegeven informatie; dit is het gewogen gemiddelde van 0, 1 en 2 verschillende kranten lezen. We kunnen de formule gebruiken voor de verwachte waarde van een kansvariabele.
De verwachte waarde is dus 0,75: Nederlanders in de steekproef zullen gemiddeld minder dan 1 krant lezen. De omvang van de steekproef komt niet voor in de formule. Deze omvang is namelijk niet relevant. Voor elke steekproefomvang hebben we de zelfde verwachting wat betreft het steekproefgemiddelde.
b. Bereken de variantie van de steekproevenverdeling voor steekproeven van 3 aselect getrokken Nederlanders.
Hiervoor moeten we een tabel met de kansverdeling opstellen. Elke respondent in de steekproef kan in 3 categorieën vallen wat betreft het aantal kranten dat hij/zij leest, dus zijn er 3 ∙ 3 ∙ 3 = 27 mogelijke uitkomsten. Verschillende volgorden van dezelfde categorieën in de steekproef hebben dezelfde kans; die kunnen we dus samenvoegen.
Mogelijke uitkomsten | Kans | Steekproefgemiddelde |
(0,0,0) | 1 ∙ 0,453 = 0,091 | 0,000 |
(0,0,1); (0,1,0); (1,0,0) | 3 ∙ 0,452 ∙ 0,35 = 0,213 | 0,333 |
(0,0,2); (0,2,0); (2,0,0) | 3 ∙ 0,452 ∙ 0,20 = 0,122 | 0,667 |
(0,1,1); (1,0,1); (1,1,0) | 3 ∙ 0,45 ∙ 0,352 = 0,165 | 0,667 |
(0,1,2); (0,2,1); (1,0,2); (1,2,0); (2,0,1); (2,1,0) | 6 ∙ 0,45 ∙ 0,35 ∙ 0,20 = 0,189 | 1,000 | (1,1,1) | 1 ∙ 0,353 = 0,043 | 1,000 |
(0,2,2); (2,0,2); (2,2,0) | 3 ∙ 0,45 ∙ 0,202 = 0,054 | 1,333 |
(1,1,2); (1,2,1); (2,1,1) | 3 ∙ 0,352 ∙ 0,20 = 0,074 | 1,333 |
(1,2,2); (2,1,2); (2,2,1) | 3 ∙ 0,35 ∙ 0,202 = 0,042 | 1,667 |
(2,2,2) | 1 ∙ 0,203 = 0,008 | 2,000 |
We kunnen nu de formule voor de verwachte variantie invullen. NB de kansvariabele (X) is hier de waarde van het steekproefgemiddelde.
De variantie in de kansverdeling is 0,20.
c. Bereken de standaardfout van het gemiddelde voor een steekproef met omvang 3 wanneer gegeven is dat de variantie in het aantal gelezen kranten in de populatie 0,588 is.
De spreiding in de populatie is bekend, dus kunnen we de formule voor de standaardfout van het steekproefgemiddelde gebruiken die bij de formules voor z staat:
De standaardfout van het steekproefgemiddelde is dus 0,44. Het gemiddeld aantal gelezen kranten in een steekproef met maar 3 Nederlanders zal 'gemiddeld' 0,44 af liggen van de verwachte waarde 0,75.
d. Vergelijk de antwoorden van vraag b en c. Wat is het verband tussen beide antwoorden?
De variantie van de kansverdeling en de standaardfout geven allebei aan hoeveel verschillen we mogen verwachten tussen de gemiddelden van verschillende steekproeven met omvang N = 3. Ze geven allebei de spreiding van de steekproevenverdeling. De variantie is het kwadraat van de standaarddeviatie. Met andere woorden, het antwoord van b is het kwadraat van het antwoord van c: 0,196 = 0,4432 (als we rekening houden met afrondingsverschillen).
Het antwoord bij c is gemakkelijker te berekenen dan het antwoord bij b, zeker wanneer de steekproeven groter worden. Daarom werken we bij voorkeur met de formule die we bij c hebben gebruikt.