Antwoord bij oefening 7.3

1. Een onderzoeker verwacht dat de betrouwbaarheid van de nieuwsmedia volgens de studenten niet veranderd is tussen 2006 en 2008. Formuleer de nulhypothese en alternatieve hypothese (met symbolen en in woorden) en toets de nulhypothese. Interpreteer de resultaten.

Controleer de variabelen op onmogelijke waarden (niet aanwezig) en op de vorm van de verdeling (redelijk normaal). NB de steekproeven zijn groot genoeg om een t-verdeling te gebruiken, ook wanneer de populatie niet normaal verdeeld is.

Nulhypothese (in woorden): in de populatie is de gemiddelde betrouwbaarheid van de nieuwsmedia volgens de studenten in 2006 gelijk aan het gemiddelde in 2008.
Alternatieve hypothese: in de populatie is de gemiddelde betrouwbaarheid van de nieuwsmedia volgens de studenten in 2006 anders dan in 2008.
Het gaat dus om een tweezijdige toets, maar dit hoeft niet expliciet gezegd te worden.
Hier is de onderzoekshypothese gelijk aan de nulhypothese: er wordt in de populatie geen verschil verwacht.

Nulhypothese (in symbolen):
H0: μv = 0. Of H0: μ2006 = μ2008.
Alternatieve hypothese (in symbolen):
H1: μv ≠ 0. Of H1: μ2006 ≠ μ2008.

Kies de juiste t-toets: afhankelijke scores (paired-samples) omdat het twee metingen zijn met dezelfde respondenten, namelijk de studenten in het panel.

Paired Samples Statistics
  Mean N Std. Deviation Std. Error Mean
Pair 1 Betrouw2006 5,1292 491 1,43556 ,06479
Betrouw2008 5,1402 491 1,45088 ,06548

Paired Samples Test
  Paired Differences t df Sig. (2-tailed)
Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference
Lower Upper
Pair 1 Betrouw2006 - Betrouw2008 -,01100 ,26502 ,01196 -,03450 ,01250 -,920 490 ,358

Rapporteer de resultaten van de t-toets: vermeld de variabelen (betrouwbaarheid van de nieuwsmedia in 2006 en in 2008) en de eenheden (studenten), vermeld het gemiddelde en de standaarddeviatie van de betrouwbaarheid van de nieuwsmedia volgens studenten in beide jaren (M = 5,13; SD = 1,44 in 2006 en M = 5,14; SD = 1,45 in 2008), en vermeld het toetsresultaat: t (490) = -0,92, p = 0,358.
NB de effectgrootte hoef je niet te berekenen en vermelden omdat het verschil niet significant is.
Geef een expliciet antwoord op de hypothesen: de nulhypothese wordt niet verworpen dus de verwachting van de onderzoeker komt uit. Er is geen verschil tussen 2006 en 2008 wat betreft de betrouwbaarheid van de nieuwsmedia volgens studenten.

2. Verdeel de schaalvariabele met de betrouwbaarheid van de nieuwsmedia volgens studenten in 2008 in 3 groepen van zoveel mogelijk gelijke omvang. Voer vervolgens met deze gegroepeerde variabele een toets uit om de volgende onderzoeksvraag te beantwoorden: hangt de mate waarin studenten de nieuwsmedia in 2008 betrouwbaar vinden samen met de krant die zij lezen (variabele v7)? Formuleer de nulhypothese die je hierbij toetst. Interpreteer de uitkomst.

Groepeer de betrouwbaarheid van de nieuwsmedia volgens studenten in 2008: de grenzen zijn 4,6 (of 4,5) en 6,0 (of 5,9). Controleer de variabele v7: er zijn geen problemen.
De nulhypothese: de mate waarin studenten de nieuwsmedia in 2008 betrouwbaar vinden hangt niet samen met de krant die zij lezen.
Gebruik de chikwadraattoets en meld in je uitkomst: de naam van de toets, de waarde van chikwadraat, de vrijheidsgraden en de significantie van het resultaat (chikwadraat (8) = 22,91, p = 0,003), interpreteer een geschikte associatiemaat (Cramer's V = 0,15 dus een zwak verband) en noem combinaties met gestandaardiseerde celresiduen boven 2 of onder -2, bijvoorbeeld dat lezers van het NRC opvallend vaak de betrouwbaarheid van de nieuwsmedia laag vinden terwijl lezers van de Telegraaf en het AD de nieuwsmedia juist opvallend vaak betrouwbaar vinden.
Geef ook een expliciet antwoord op de onderzoeksvraag: ja, de verwachting van de onderzoeker komt hier uit.
Betrouwbaarheid van de nieuwsmedia in 2008 gegroepeerd * Welke krant leest U? Crosstabulation
  Welke krant leest U? Total
nrchandelsblad volkskrant telegraaf/AD trouw anders
Betrouwbaarheid van de nieuwsmedia in 2008 gegroepeerd Lage betrouwbaarheid Count 28 25 20 3 104 180
Expected Count 20,4 26,0 33,8 4,5 95,4 180,0
Std. Residual 1,7 -,2 -2,4 -,7 ,9  
Middelmatige betrouwbaarheid Count 20 26 32 6 85 169
Expected Count 19,2 24,4 31,7 4,2 89,6 169,0
Std. Residual ,2 ,3 ,1 ,9 -,5  
Hoge betrouwbaarheid Count 7 19 39 3 68 136
Expected Count 15,4 19,6 25,5 3,4 72,1 136,0
Std. Residual -2,1 -,1 2,7 -,2 -,5  
Total Count 55 70 91 12 257 485
Expected Count 55,0 70,0 91,0 12,0 257,0 485,0

Symmetric Measures
  Value Approx. Sig.
Nominal by Nominal Phi .217 .003
Cramer's V .154 .003
N of Valid Cases 485  

3. Volgens branchegegevens had het NRC een marktaandeel van 11% en Trouw een marktaandeel van 6%. Toets of de steekproef representatief is op dit punt. Vermeld de nulhypothese(n) en interpreteer de resultaten. Hoe verklaar je het resultaat?

Beschrijf eerst de variabele: 4 kranten zijn uitgesplitst en de resterende kranten zijn samengevoegd in de categorie 'anders'.
Je moet nu de proporties in de steekproef toetsen tegen de proporties in de populatie (de marktaandelen). Je kunt er nu voor kiezen om NRC en Trouw samen te toetsen of aparte toetsen uit te voeren voor NRC en Trouw.
Wanneer je NRC en Trouw samen wilt toetsen, moet je variabele V7 hercoderen zodat je 3 categorieën overhoudt: NRC, Trouw en de rest (waarin ook de oorspronkelijke categorie 'anders' zit). Het marktaandeel van de Volkskrant en Telegraaf/AD is niet gegeven, dus die moet je met de restcategorie 'anders' samenvoegen. Voor de nieuwe gegroepeerde variabele weet je de marktaandelen in de populatie van alle krantenlezers: NRC 11%, Trouw 6% dus de rest 100% - (11% + 6%) = 83%.

Je wilt nu een toets uitvoeren op één categorische variabele met meer dan twee waarden, dus gebruik je de chikwadraattoets voor frequenties van één nominale variabele.

Hypothesis Test Summary
  Null Hypothesis Test Sig. Decision
1 The categories of NRC versus Trouw versus rest. occur with the specified probabilities. One-Sample Chi-Square Test .004 Reject the null hypothesis
Asymptotic significances are displayed. The significance level is .05.

De toets is significant dus verwerpen we de nulhypothese dat NRC en Trouw samen de veronderstelde proporties hebben in de populatie waaruit de steekproef getrokken is, chikwadraat (2) = 11,03, p = 0,004. Die populatie is dus anders dan de populatie van alle Nederlanders. Anders gezegd: de steekproef is niet representatief voor de populatie van alle Nederlanders.
NB je krijgt de waarde van chikwadraat en het aantal vrijheidsgraden pas te zien wanneer je dubbelklikt op de resultatentabel in de SPSS outout.

De andere mogelijkheid is dat je aparte toetsen uitvoert voor NRC en Trouw. Dan moet je twee nieuwe dichotome variabelen maken wel/niet NRC en wel/niet Trouw. Vervolgens kun je dan twee toetsen op een proportie uitvoeren: voor NRC met als toetswaarde 0.11 en voor Trouw met toetswaarde .06.

Hypothesis Test Summary
  Null Hypothesis Test Sig. Decision
1 The categories defined by NRC versus rest = (NRC) and (Geen NRC) occur with probabilities 0.11 and 0.89. One-Sample Binomial Test .472 Retain the null hypothesis
Asymptotic significances are displayed. The significance level is .05.

Hypothesis Test Summary
  Null Hypothesis Test Sig. Decision
1 The categories defined by Trouw versus rest = (Trouw) and (Geen Trouw) occur with probabilities 0.06 and 0.94. One-Sample Binomial Test .001 Reject the null hypothesis
Asymptotic significances are displayed. The significance level is .05.

Voor het NRC vinden we geen significant verschil tussen de proportie in de steekproef (11.2%) en die in de populatie van alle Nederlanders (11%), p = 0,472. De steekproefproportie bij Trouw onder de studenten (2,4%) is daarentegen wel significant lager dan de 6% marktaandeel onder alle Nederlanders, p = 0,001. Wat betreft NRC-lezers is de steekproef van studenten dus wel representatief voor alle Nederlanders maar voor Trouw niet.
Kennelijk is Trouw onder studenten relatief weinig populair. Studenten zijn jonger en hoger opgeleid dan de gemiddelde Nederlander; dat kan de lagere populariteit van Trouw misschien verklaren. In ieder geval is het raar om te verwachten dat de studentenpopulatie representatief is voor alle Nederlanders wat betreft de kranten die zij lezen.

NB we hebben nu twee toetsen uitgevoerd terwijl we met de chikwadraattoets maar één toets nodig hadden. De kans dat minstens een van de twee laatste toetsen significant is, is groter dan de 5% die we voor elke toets afzonderlijk hanteerden (kanskapitalisatie).
Bij de gevonden resultaten hoef je daar niet wakker van te liggen want de overschrijdingskans bij Trouw ligt zo ver onder 5% dat we dezelfde conclusie zouden trekken wanneer we een strenger significantieniveau zouden hanteren, bijvoorbeeld de helft van 5%.

Syntax

*Oefening 7_3.

*Vraag 1: toets op verschil tussen 2006 en 2008.
*Controle op normale verdeling.
FREQUENCIES VARIABLES=V27 V28
  /FORMAT=NOTABLE
  /HISTOGRAM NORMAL
  /ORDER=ANALYSIS.
*T-toets voor afhankelijke scores.
T-TEST
  PAIRS = V27 WITH V28 (PAIRED)
  /CRITERIA = CI(.95)
  /MISSING = ANALYSIS.

*Vraag 2: verschillen tussen kranten wat betreft de ervaren betrouwbaarheid van de nieuwsmedia in 2008.
*Schaalvariabele voor 2008 in 3 gelijke groepen verdelen.
*Bepaal de grenzen tussen de groepen.
FREQUENCIES
  VARIABLES=V28
  /NTILES= 3
  /ORDER= ANALYSIS .
*Hercodeer de groepen.
RECODE
  V28
  (Lowest thru 4.6=1) (4.6 thru 6.0=2) (6.0 thru Highest=3) INTO
  Betr2008groep .
VARIABLE LABELS Betr2008groep 'Betrouwbaarheid van de nieuwsmedia in 2008'+
' gegroepeerd'.
EXECUTE .
*Define Variable Properties.
*Betr2008groep.
VALUE LABELS Betr2008groep
   1 'Lage betrouwbaarheid'
   2 'Middelmatige betrouwbaarheid'
   3 'Hoge betrouwbaarheid' .
EXECUTE.
*Kruistabelanalyse met chikwadraattoets.
CROSSTABS
  /TABLES=Betr2008groep BY v7
  /FORMAT=AVALUE TABLES
  /STATISTICS=CHISQ PHI
  /CELLS=COUNT EXPECTED SRESID
  /COUNT ROUND CELL.

*Vraag 3: representativiteit qua marktaandeel van kranten.
FREQUENCIES VARIABLES=v7
  /ORDER=ANALYSIS.
*Optie 1: NRC en Trouw samen toetsen tegenover de rest.
*Groeperen Volkskrant, Telegraaf/AD en 'anders'.
RECODE v7 (1=1) (4=2) (ELSE=3) INTO V7her1.
VARIABLE LABELS V7her1 'NRC versus Trouw versus rest.'.
EXECUTE.
* Define Variable Properties.
*V7her1.
VALUE LABELS V7her1
  1.00 'NRC'
  2.00 'Trouw'
  3.00 'overige kranten'.
EXECUTE.
*chikwadraattoets op 1 frequentieverdeling.
*Nonparametric Tests: One Sample.
NPTESTS
  /ONESAMPLE TEST (V7her1) CHISQUARE(EXPECTED=CUSTOM(CATEGORIES=1 2 3 FREQUENCIES=11.0 6.0 83.0 ))
  /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
  /CRITERIA ALPHA=0.05 CILEVEL=95.
*Optie 2: NRC en Trouw apart toetsen.
*Dichotomieën aanmaken voor NRC en Trouw.
RECODE v7 (1=1) (ELSE=0) INTO NRC.
VARIABLE LABELS NRC 'NRC versus rest'.
EXECUTE.
RECODE v7 (4=1) (ELSE=0) INTO Trouw.
VARIABLE LABELS Trouw 'Trouw versus rest'.
EXECUTE.
* Define Variable Properties.
*NRC.
VALUE LABELS NRC
  .00 'Geen NRC'
  1.00 'NRC'.
*Trouw.
VALUE LABELS Trouw
  .00 'Geen Trouw'
  1.00 'Trouw'.
EXECUTE.
*(Binomiaal)toetsen op proporties.
*Nonparametric Tests: One Sample.
NPTESTS
  /ONESAMPLE TEST (NRC) BINOMIAL(TESTVALUE=0.11 SUCCESSCATEGORICAL=LIST(1)
   SUCCESSCONTINUOUS=CUTPOINT(MIDPOINT))
  /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
  /CRITERIA ALPHA=0.05 CILEVEL=95.
NPTESTS
  /ONESAMPLE TEST (Trouw) BINOMIAL(TESTVALUE=0.06 SUCCESSCATEGORICAL=LIST(1)
   SUCCESSCONTINUOUS=CUTPOINT(MIDPOINT))
  /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
  /CRITERIA ALPHA=0.05 CILEVEL=95.