Antwoord bij rekenopgave 3.6e

a. Leveren de gegevens voldoende bewijs dat er een verschil bestaat in gemiddelde verandering van mening over de Europese Gemeenschap tussen respondenten die versie A of versie B hebben gelezen? Toets voor α = 0,05.

Stap 1: Stel de hypothesen op. H0 : μ1 = μ2 ; H1 : μ1 ≠ μ2 . Het is een tweezijdige toets.

Stap 2: Kies de kansverdeling en de toets.
We kunnen de toetsingsgrootheid t gebruiken. De steekproeven zijn kleiner dan 30, maar we mogen uitgaan van een normale verdeling van de variabele 'verandering van mening' in de populatie, zodat de t-verdeling toch gebruikt kan worden.

Stap 3: Bepaal de kritieke waarde en het kritieke gebied. Zoek de kritieke waarde van t op, d.w.z. de waarde waarboven de nulhypothese verworpen wordt.
Om het aantal vrijheidsgraden te bepalen, moeten we weten of we mogen uitgaan van gelijke varianties in de populatie. Dit is niet gegeven, dus moeten we zelf een F-toets uitvoeren om hier achter te komen. We mogen de toets hier uitvoeren omdat gegeven is dat de variabele normaal verdeeld is in de populatie. We moeten de vaste 5 stappen bij een toets dus nu eerst doen voor de F-toets.

  1. Stel de hypothesen op.
    Bij de F-toets is de nulhypothese dat de varianties van de numerieke variabele in de ene populatie (de populatie waaruit de mannelijke personages zijn getrokken) gelijk is aan de variantie van deze variabele in de andere populatie (de populatie waaruit de vrouwelijke personages zijn getrokken).
    H0: σ2Versie A = σ2Versie B
    H1: σ2Versie A ≠ σ2Versie B
  2. Kies de kansverdeling en de toets.
    Varianties toetsen we met de F-verdeling als kansverdeling. We voeren een F-toets uit.
  3. Bepaal de kritieke waarde en het kritieke gebied.
    De F-toets heeft twee aantallen vrijheidsgraden: df1 = n1 - 1 en df2 = n2 - 1 waarbij s12 > s22
    Aangezien de geschatte populatievariantie bij Versie A groter (s2 = 0,010) is dan bij Versie B (s2 = 0,002), moet Versie A in de teller en bepaalt de omvang van de steekproef bij Versie A het aantal vrijheidsgraden in de teller. Versie B hoort in de noemer: df1 = nVersie A - 1 = 27 - 1 = 26 en df2 = nVersie B - 1 = 23 - 1 = 22.
    In de F-tabel staat geen kolom voor 26 vrijheidsgraden in de teller, dus nemen we de dichtstbijzijnde kolom met (een lager) aantal vrijheidsgraden, dus 24 vrijheidsgraden. In deze kolom vinden we als kritieke waarde F = 2,3 bij de rij met 22 vrijheidsgraden.
    Het kritieke gebied bestaat uit alle F-waarden van 2,3 en hoger.
  4. Bereken nu de F-waarde voor deze steekproef.
    De geschatte populatievarianties zijn gegeven dus de berekening is eenvoudig:
  5. Trek een conclusie.
    De F-waarde in de steekproef is hoger dan 2,3 en ligt dus in het kritieke gebied. Dan verwerpen we de nulhypothese en gaan we ervan uit dat de varianties in de populatie voor beide groepen (steekproeven) ongelijk zijn, F (26, 22) = 5,00, p < 0,05.

Nu kunnen we verder gaan met stap 3 van de t-toets en het aantal vrijheidsgraden voor deze toets berekenen uitgaande van verschillende varianties in de populatie.

De toets heeft 38,70 vrijheidsgraden. In de tabel zoeken we bij de dichtstbijzijnde lagere waarde, dus bij 38 vrijheidsgraden.
Het significantieniveau (tweezijdig) is α = 5%, dus de kritieke waarde van t in de tabel is 2,024. Het kritieke gebied is dus t ≤ -2,024 en t ≥ 2,024.

Stap 4: Bereken nu de t-waarde voor deze steekproef.
Begin met het uitrekenen van de standaardfout SE:

en vul dan de formule voor t in:

Stap 5: Trek een conclusie: De gevonden t-waarde (-2,663) is kleinerdan de linker kritieke waarde (-2,024) dus ligt de gevonden t-waarde in het kritieke gebied. Het resultaat is statistisch significant en we verwerpen de nulhypothese. We gaan ervan uit dat er een verschil is tussen de twee populatiegemiddelden. Het gemiddelde verschil bij dagblad B in de steekproef (M = -3,1, SD = 1,41) is significant kleiner dan bij dagblad A (M = -4,9, SD = 3,16), t (38,70) = -2,663, p < 0,05.
NB de standaarddeviaties verkrijg je door de wortel van de varianties te nemen.

b. Bepaal een 95% betrouwbaarheidsinterval voor de gemiddelde verandering tussen de lezers van de twee dagbladversies en interpreteer dit.

Bij vraag a hebben we de kritieke waarde van t al bepaald (2,024) en we hebben de standaardfout van het verschil tussen de twee steekproefgemiddelden berekend. We kunnen de formule voor het betrouwbaarheidsinterval daarom direct invullen:

Het 95% betrouwbaarheidsinterval is dus 95% CI [-3,17, -0,43]. Met 95% zekerheid kunnen we dus zeggen dat het verschil tussen de verandering in het oordeel bij de twee versies (Versie A min Versie B) van het dagblad ligt tussen -3,17 en -0,43. Een gemiddelde verschil van 0 (oftewel, er is geen verschil) ligt niet in het betrouwbaarheidsinterval, wat overeenkomt met het resultaat dat de toets bij vraag a significant is.

Wanneer je als verschil het gemiddelde van versie B min het gemiddelde van versie A neemt, krijg je een gemiddeld verschil van +1,8 en een betrouwbaarheidsinterval 95% CI [0,43, 3,17]. De interpretatie komt dan op hetzelfde neer: Met 95% zekerheid kunnen we zeggen dat het verschil tussen de verandering in het oordeel bij de twee versies (Versie B min Versie A) van het dagblad ligt tussen 0,43 en 3,17.