Antwoord bij Oefening 4.1

a. Toets of er samenhang is tussen sekse en de krant die respondenten lezen en, zo ja, bespreek de aard en sterkte van de samenhang.

Het gaat hier om twee nominale variabelen, dus moeten we een kruistabel maken om de samenhang te toetsen.
De toets zelf doen we met behulp van chikwadraat, die we als statistiek kunnen opvragen bij de kruistabel. De sterkte van de samenhang lezen we af van een gepaste associatiemaat. Hier is het meetniveau van beide variabelen nominaal en is er sprake van een asymmetrisch verband (sekse kan krantenvoorkeur bepalen maar niet andersom), dus kiezen we lambda of Goodman & Kruskal's tau.
Alle cellen blijken een verwachte waarde van 5 of meer te hebben, dus de chikwadraattoets mag toegepast worden. Er blijkt echter geen significante associatie te zijn, chikwadraat (8) = 9,09, niet significant).
Chi-Square Tests

Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 9,089(a) 8 ,335
Likelihood Ratio 9,172 8 ,328
Linear-by-Linear Association 1,386 1 ,239
N of Valid Cases 1541

a 0 cells (,0%) have expected count less than 5. The minimum expected count is 17,99.

We hoeven nu eigenlijk niet meer naar de associatiematen te kijken. Voor didaktische doeleinden doen we dat toch, om te zien dat de associatiematen ook niet significant zijn, wat betekent dat we ervan uit moeten gaan dat er in de populatie geen verband is (de associatiematen kunnen daar de waarde nul hebben).
Directional Measures



Value Asymp. Std. Error(a) Approx. T(b) Approx. Sig.
Nominal by Nominal Lambda Symmetric ,021 ,014 1,472 ,141
Welke krant leest U? Dependent ,000 ,000 .(c) .(c)
Bent u een vrouw of man? Dependent ,053 ,035 1,472 ,141
Goodman and Kruskal tau Welke krant leest U? Dependent ,001 ,001
,370(d)
Bent u een vrouw of man? Dependent ,006 ,004
,335(d)
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.
c Cannot be computed because the asymptotic standard error equals zero.
d Based on chi-square approximation

Verschillen tussen mannen en vrouwen die uit de kruistabel naar voren komen, bijvoorbeeld dat een groter percentage van de mannen het NRC leest dan bij de vrouwen, zijn vermoedelijk een kenmerk van de steekproef maar niet van de populatie aangezien de gestandaardiseerde residuen niet boven 1,96 of onder -1,96 liggen.
v7 Welke krant leest U? * v1 Bent u een vrouw of man? Crosstabulation
  v1 Bent u een vrouw of man? Total
0 vrouw 1 man
v7 Welke krant leest U? 1 nrchandelsblad Count 75 91 166
Expected Count 83,1 82,9 166,0
Std. Residual -,9 ,9  
2 volkskrant Count 110 112 222
Expected Count 111,1 110,9 222,0
Std. Residual -,1 ,1  
3 telegraaf Count 111 108 219
Expected Count 109,6 109,4 219,0
Std. Residual ,1 -,1  
4 algemeendagblad Count 53 60 113
Expected Count 56,5 56,5 113,0
Std. Residual -,5 ,5  
5 trouw Count 12 24 36
Expected Count 18,0 18,0 36,0
Std. Residual -1,4 1,4  
6 parool Count 44 37 81
Expected Count 40,5 40,5 81,0
Std. Residual ,5 -,5  
7 spits/metro Count 208 178 386
Expected Count 193,1 192,9 386,0
Std. Residual 1,1 -1,1  
8 nrc next Count 40 38 78
Expected Count 39,0 39,0 78,0
Std. Residual ,2 -,2  
9 anders Count 118 122 240
Expected Count 120,1 119,9 240,0
Std. Residual -,2 ,2  
Total Count 771 770 1541
Expected Count 771,0 770,0 1541,0

b. Wat is het verwerpingsgebied bij vraag a bij een toets met 5% significantieniveau?

De chikwadraattoets heeft 8 vrijheidsgraden, die je uit de tabel van SPSS kunt aflezen of zelf kunt berekenen: df = (k - 1)(r - 1) = (2 - 1)(9 - 1) = 8.
In de tabel met kritieke waarden van chikwadraat (Bijlage 4 in het boek van Van Peet et al.) vinden we voor α = 0,05 als kritieke waarde 15,51. Het verwerpingsgebied is dus alle chikwadraatwaarden van 15,51 en hoger.
NB bij een chikwadraattoets kijk je bij een toets alleen naar de rechter staart van de kansverdeling.

c. Toets of er samenhang is tussen de krant die respondenten lezen en hoe vaak ze naar het nieuws kijken; zo ja, bespreek de aard en sterkte van de samenhang.

We hebben een nominale variabele (v7 - krant) en een ordinale (v8 - hoe vaak kijkt u naar het nieuws op tv), dus moeten we weer een kruistabel gebruiken en associatiematen op nominaal meetniveau. Nu is het lastig om een asymmetrisch verband te zien, dus kiezen we voor Cramer's V als associatiemaat.
We vinden weliswaar een significante samenhang, chikwadraat (40) = 77,67, I>p < 0,001, maar er blijken veel cellen in de kruistabel te zitten met te weinig verwachte waarnemingen: 24% heeft minder dan 5 verwachte waarnemingen. Bovendien zijn er cellen met een verwachte waarde onder de 1. We mogen de chikwadraattoets daarom niet gebruiken.

Fisher's exacte toets zouden we kunnen gebruiken - je moet deze toets dan opvragen met de keuze Exact in het menu Exact bij de kruistabel in SPSS - maar het kan lang duren voordat deze toets uitgerekend is wanneer de kruistabel meer dan 4 cellen heeft. Een alternatief dat we hebben is het aantal cellen verlagen. Het makkelijkst kunnen we het aantal categorieën reduceren in de variabele 'kijken naar het nieuws' omdat aangrenzende waarden hier op elkaar lijken. Bovendien zijn er sommige categorieën die in totaal erg weinig voorkomen (bijvoorbeeld 'nooit' komt maar 11 keer voor), dus hier vinden we de te lage verwachte waarden.
De categorieën voor het kijken naar tv nieuws kunnen op verschillende manieren worden samengenomen. Hier nemen we de catgorieën 'nooit', 'zelden' en 'soms' samen.
We vinden nu een significante samenhang, chikwadraat (24) = 58,44, p < 0,001) en alle cellen hebben het minimum aantal verwachte waarnemingen. We kunnen nu dus wel afgaan op de chikwadraattoets. De samenhang is echter zwak (Cramer's V = 0,11). Enkele opvallende verschillen zijn: relatief veel Trouw-lezers (36,1%) kijken zeer vaak naar het televisienieuws maar veel Spits/Metro-lezers kijken juist weinig naar het televisienieuws (31,1%).
v7 Welke krant leest U? * v8 Hoe vaak kijkt u naar het nieuws op televisie? Crosstabulation
  v8 Hoe vaak kijkt u naar het nieuws op televisie? Total
1 nooit 2 zelden 3 soms 4 tamelijk vaak 5 vaak 6 zeer vaak
v7 Welke krant leest U? 1 nrchandelsblad Count 0 11 18 38 57 41 165
Expected Count 1,2 7,3 28,6 38,0 51,3 38,7 165,0
Std. Residual -1,1 1,4 -2,0 ,0 ,8 ,4  
2 volkskrant Count 1 11 30 42 73 65 222
Expected Count 1,6 9,8 38,5 51,1 69,0 52,0 222,0
Std. Residual -,5 ,4 -1,4 -1,3 ,5 1,8  
3 telegraaf Count 0 6 35 64 58 55 218
Expected Count 1,6 9,6 37,8 50,2 67,8 51,1 218,0
Std. Residual -1,2 -1,2 -,5 1,9 -1,2 ,6  
4 algemeendagblad Count 1 4 12 28 43 25 113
Expected Count ,8 5,0 19,6 26,0 35,1 26,5 113,0
Std. Residual ,2 -,4 -1,7 ,4 1,3 -,3  
5 trouw Count 0 2 6 5 10 13 36
Expected Count ,3 1,6 6,2 8,3 11,2 8,4 36,0
Std. Residual -,5 ,3 -,1 -1,1 -,4 1,6  
6 parool Count 1 0 7 21 33 21 83
Expected Count ,6 3,7 14,4 19,1 25,8 19,4 83,0
Std. Residual ,5 -1,9 -1,9 ,4 1,4 ,4  
7 spits/metro Count 5 19 96 92 108 66 386
Expected Count 2,8 17,0 66,9 88,9 120,0 90,4 386,0
Std. Residual 1,4 ,5 3,6 ,3 -1,1 -2,6  
8 nrc next Count 0 7 12 20 25 14 78
Expected Count ,6 3,4 13,5 18,0 24,2 18,3 78,0
Std. Residual -,7 1,9 -,4 ,5 ,2 -1,0  
9 anders Count 3 8 51 45 72 61 240
Expected Count 1,7 10,6 41,6 55,3 74,6 56,2 240,0
Std. Residual 1,0 -,8 1,5 -1,4 -,3 ,6  
Total Count 11 68 267 355 479 361 1541
Expected Count 11,0 68,0 267,0 355,0 479,0 361,0 1541,0

d. Is het verband dat bij (c) onderzocht is, verschillend voor mannen en vrouwen?

We moeten nu tabelsplitsing toepassen: een kruistabel tussen krant en de frequentie van het nieuws kijken voor de vrouwen en een kruistabel voor de mannen. Dit kan makkelijk gedaan worden door de sekse variabele als Layer in te vullen in het CROSSTABS commando. Gebruik weer de gegroepeerde versie van de nieuwskijken-variabele om voldoende waarnemingen in de cellen te krijgen.
Er blijkt zowel bij de mannen, χ2 (24) = 41,50, p = 0,015, als de vrouwen, χ2 (24) = 38,93, p = 0,028, een significant verband te zijn tussen de krant die men leest en hoe vaak men naar het televisienieuws kijkt. In beide gevallen is het verband zwak (Cramer's V = 0,13).
In de kruistabellen zien we nagenoeg hetzelfde patroon bij de mannen als bij de vrouwen. Bij beide seksen vinden we significant veel waarnemingen respondenten die de Spits of Metro nooit tot soms meten (de gestandaardiseerde residuen zijn hier hoger dan 1,96). Wel zien we bij de vrouwen een aanvullend significant verschil bij het Parool (significant weinig 'nooit tot soms' en 'tamelijk vaak' gelezen) terwijl we bij de mannen een significant resultaat zien bij De Volkskrant (significant 'zeer vaak' gelezen).
We concluderen dat het verband tussen de krant die men leest en hoe vaak men naar het televisienieuws kijkt, alleen op details verschilt tussen mannen en vrouwen.
Chi-Square Tests
Bent u een vrouw of man?
Value df Asymp. Sig. (2-sided)
vrouw Pearson Chi-Square 38,926(a) 24 ,028
Likelihood Ratio 41,625 24 ,014
Linear-by-Linear Association 4,933 1 ,026
N of Valid Cases 771

man Pearson Chi-Square 41,498(b) 24 ,015
Likelihood Ratio 42,006 24 ,013
Linear-by-Linear Association 7,445 1 ,006
N of Valid Cases 768

a 4 cells (11,1%) have expected count less than 5. The minimum expected count is 2,68.
b 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,25.
Symmetric Measures
Bent u een vrouw of man?

Value Approx. Sig.
vrouw Nominal by Nominal Phi ,225 ,028
Cramer's V ,130 ,028
N of Valid Cases 771
man Nominal by Nominal Phi ,232 ,015
Cramer's V ,134 ,015
N of Valid Cases 768
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.

v7 Welke krant leest U? * v8HER TV nieuws kijken (4 waarden) * v1 Bent u een vrouw of man? Crosstabulation
v1 Bent u een vrouw of man? v8HER TV nieuws kijken (4 waarden) Total
3,00 nooit tot soms 4,00 tamelijk vaak 5,00 vaak 6,00 zeer vaak
0 vrouw v7 Welke krant leest U? 1 nrchandelsblad Count 9 19 26 21 75
Expected Count 16,9 18,1 23,2 16,7 75,0
Std. Residual -1,9 ,2 ,6 1,0  
2 volkskrant Count 23 24 39 24 110
Expected Count 24,8 26,5 34,1 24,5 110,0
Std. Residual -,4 -,5 ,8 -,1  
3 telegraaf Count 21 34 31 25 111
Expected Count 25,1 26,8 34,4 24,8 111,0
Std. Residual -,8 1,4 -,6 ,0  
4 algemeendagblad Count 9 13 19 12 53
Expected Count 12,0 12,8 16,4 11,8 53,0
Std. Residual -,9 ,1 ,6 ,1  
5 trouw Count 2 4 3 3 12
Expected Count 2,7 2,9 3,7 2,7 12,0
Std. Residual -,4 ,6 -,4 ,2  
6 parool Count 3 10 19 12 44
Expected Count 9,9 10,6 13,6 9,8 44,0
Std. Residual -2,2 -,2 1,5 ,7  
7 spits/metro Count 62 55 55 36 208
Expected Count 46,9 50,2 64,5 46,4 208,0
Std. Residual 2,2 ,7 -1,2 -1,5  
8 nrc next Count 12 10 13 5 40
Expected Count 9,0 9,6 12,4 8,9 40,0
Std. Residual 1,0 ,1 ,2 -1,3  
9 anders Count 33 17 34 34 118
Expected Count 26,6 28,5 36,6 26,3 118,0
Std. Residual 1,2 -2,1 -,4 1,5  
Total Count 174 186 239 172 771
Expected Count 174,0 186,0 239,0 172,0 771,0
1 man v7 Welke krant leest U? 1 nrchandelsblad Count 20 19 31 20 90
Expected Count 20,2 19,7 28,1 22,0 90,0
Std. Residual ,0 -,2 ,5 -,4  
2 volkskrant Count 19 18 34 41 112
Expected Count 25,1 24,5 35,0 27,4 112,0
Std. Residual -1,2 -1,3 -,2 2,6  
3 telegraaf Count 20 30 27 30 107
Expected Count 24,0 23,4 33,4 26,2 107,0
Std. Residual -,8 1,4 -1,1 ,7  
4 algemeendagblad Count 8 15 24 13 60
Expected Count 13,4 13,1 18,8 14,7 60,0
Std. Residual -1,5 ,5 1,2 -,4  
5 trouw Count 6 1 7 10 24
Expected Count 5,4 5,3 7,5 5,9 24,0
Std. Residual ,3 -1,9 -,2 1,7  
6 parool Count 5 10 14 8 37
Expected Count 8,3 8,1 11,6 9,1 37,0
Std. Residual -1,1 ,7 ,7 -,4  
7 spits/metro Count 58 37 53 30 178
Expected Count 39,9 38,9 55,6 43,6 178,0
Std. Residual 2,9 -,3 -,4 -2,1  
8 nrc next Count 7 10 12 9 38
Expected Count 8,5 8,3 11,9 9,3 38,0
Std. Residual -,5 ,6 ,0 -,1  
9 anders Count 29 28 38 27 122
Expected Count 27,3 26,7 38,1 29,9 122,0
Std. Residual ,3 ,3 ,0 -,5  
Total Count 172 168 240 188 768
Expected Count 172,0 168,0 240,0 188,0 768,0

Syntax

*Syntax bij oefening 4_1.

*Opgave a.
*NB controleer eerst de data en schoon indien nodig.
FREQUENCIES
  VARIABLES=v1 v7
  /ORDER= ANALYSIS .
*Define Variable Properties.
*v1.
VALUE LABELS v1
     0 'vrouw'
     1 'man' .
EXECUTE.
*De kruistabel met chikwadraat en de juiste associatiemaat (nominaal, asymmetrisch).
CROSSTABS
  /TABLES=v7 BY v1
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ LAMBDA
  /CELLS= COUNT EXPECTED SRESID
  /COUNT ROUND CELL .

*Opgave b.
FREQUENCIES
  VARIABLES=v8
  /ORDER= ANALYSIS .
*Kruistabel met associatiematen.
CROSSTABS
  /TABLES=v7 BY v8
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ PHI
  /CELLS= COUNT EXPECTED SRESID
  /COUNT ROUND CELL .
*Samenvoegen categorieën van v8.
RECODE
  v8
  (1 thru 3=3) (ELSE=Copy) INTO v8HER .
VARIABLE LABELS v8HER 'TV nieuws kijken (4 waarden)'.
EXECUTE .
*Define Variable Properties.
*v8HER.
VALUE LABELS v8HER
     3 'nooit tot soms'
     4 'tamelijk vaak'
     5 'vaak'
     6 'zeer vaak' .
EXECUTE.*Nieuwe kruistabel met associatiematen.
CROSSTABS
  /TABLES=v7 BY v8HER
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ PHI
  /CELLS= COUNT EXPECTED SRESID
  /COUNT ROUND CELL .

*Opgave c.
CROSSTABS
  /TABLES=v7 BY v8HER BY v1
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ PHI
  /CELLS= COUNT EXPECTED SRESID
  /COUNT ROUND CELL .