Antwoord bij Oefening 4.3

a. Toets de hypothese dat vrouwen die een kans hebben om Beau Monde te lezen, ook een kans hebben om Elegance te lezen. Ben je op grond van de resultaten van mening dat het voldoende is om een advertentie in Beau Monde te plaatsen om ook de (potentiële) lezers van Elegance te bereiken?

We werken steeds met gehercodeerde versies van de leeskans-variabelen waarin een leeskans van precies 0 de ene waarde is en een leeskans hoger dan 0 de andere waarde. We hebben dus categorische variabelen en moeten chikwadraattoetsen uitvoeren.
Bij opgave (a) moeten we in feite toetsen of er een verband (samenhang, associatie) is tussen de (gehercodeerde) leeskans voor Beau Monde en Elegance. Een kruistabel met de chikwadraatwaarde en een symmetrische associatiemaat (Phi of Cramer's V) volstaat. Vergeet niet om eerst alleen de vrouwen te selecteren!

Er blijkt een significant verband te zijn tussen de twee leeskansen, fisher exact, p < 0,001. NB we gebruiken fisher's exacte toets omdat we een 2x2 kruistabel hebben.
Wanneer we naar de kruistabel kijken, zien we dat de waargenomen frequentie van respondenten met een leeskans voor beide tijdschriften (fo = 28) hoger ligt dan de verwachte waarde (fe = 10,6, gestandaardiseerd celresidu = 5,3). Dit betekent dat een leeskans op het ene blad inderdaad relatief vaak samenvalt met een leeskans op het andere blad.
De samenhang is echter zwak (Phi = 0,19; p < 0,001). Het is dus zeker niet zo dat alle of het merendeel van de respondenten met een leeskans op het ene blad ook een leeskans op het andere blad hebben. Dit betekent dat je via het ene blad maar een beperkt aantal (potentiële) lezers van het andere blad bereikt. Als er geld is voor advertenties in beide bladen, is dat aan te bevelen.

Leeskans Elegance dichotoom * Leeskans Beau Monde dichotoom Crosstabulation
  Leeskans Beau Monde dichotoom Total
Geen leeskans Leeskans
Leeskans Elegance dichotoom Geen leeskans Count 789 37 826
Expected Count 771,6 54,4 826,0
Std. Residual ,6 -2,4  
Leeskans Count 133 28 161
Expected Count 150,4 10,6 161,0
Std. Residual -1,4 5,3  
Total Count 922 65 987
Expected Count 922,0 65,0 987,0
Chi-Square Tests

Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided)
Pearson Chi-Square 36,514(b) 1 ,000

Continuity Correction(a) 34,445 1 ,000

Likelihood Ratio 28,346 1 ,000

fisher's Exact Test


,000 ,000
Linear-by-Linear Association 36,477 1 ,000

N of Valid Cases 987



a Computed only for a 2x2 table
b 0 cells (,0%) have expected count less than 5. The minimum expected count is 10,60.
Symmetric Measures


Value Approx. Sig.
Nominal by Nominal Phi ,192 ,000
Cramer's V ,192 ,000
N of Valid Cases 987
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.

b. Zijn Elegance en Beau Monde bladen voor de werkende vrouw? Gebruik dichotome leeskansen en de variabele WERKZ om een onderscheid te maken tussen vrouwen met en zonder beroep.

Misschien wil je hier liever asymmetrische associatiematen (op nominaal meetniveau) gebruiken indien je verwacht dat de leeskans kan afhangen van het hebben van een beroep en niet andersom.
Bij Elegance vinden we geen significante samenhang tussen het uitoefenen van een beroep en de leeskans, fisher exact p = 0,299. Wanneer je de toets eenzijdig uitvoert, namelijk wanneer je uitsluit dat de bladen juist meer door niet-werkende vrouwen worden gelezen, is de overschrijdingskans van de Fischer-exact toets p = 0,16, dus ook niet significant.
Een significante samenhang vinden we echter wel bij Beau Monde, fisher exact p = 0,014. De samenhang is echter zeer zwak (Goodman en Kruskal's tau = 0,006, p = 0,013). In de kruistabel kunnen we zien dat Beau Monde bij de werkzame vrouwen vaker voorkomt dan verwacht, dit blad is een klein beetje meer in trek bij werkende vrouwen dan bij niet-werkzame vrouwen.
Het gestandaardiseerd celresidu (1,8) is net niet significant, maar trek je daar niets van aan: de z-toets op het celresidu is minder precies dan de fisher-exact toets.

c. Zijn Elegance en Beau Monde bladen voor de rijkere vrouw? Gebruik dichotome leeskansen en de variabele INKOM om een onderscheid te maken tussen minder rijke (modaal of beneden modaal) en rijkere (boven modaal) vrouwen.

Bij Elegance vinden we een (net) significant verschil tussen de rijkere en minder rijke vrouwen wat betreft hun leeskans, fisher exact p = 0,050. Als 0,05 de maximale kans is die we toestaan om de nulhypothese ten onrechte te verwerpen, dan mogen we die nulhypothese hier dus net verwerpen. Wanneer je het precies wilt weten, moet je de tabel in de tabel editor openen (dubbelklik op de tabel) en vervolgens dubbelklikken op het getal 0,050. Je ziet dan de preciezere overschrijdingskans: 0,0498026310202801.
De samenhang is echter zeer zwak (Goodman en Kruskal's tau = 0,005; p = 0,047). Vrouwen die boven modaal verdienen hebben wat vaker een leeskans (fo = 64) dan verwacht op basis van toeval (fe = 53,4) en bij de minder rijke vrouwen is dit andersom.
Bij de leeskans van Beau Monde vinden we geen significant verschil tussen de rijkere en minder rijke vrouwen, fisher exact p = 0,323. Hier moeten we ervan uitgaan dat er in de populatie geen verschil is.

d. Heeft het uitoefenen van een beroep hetzelfde effect op de leeskans van Elegance en Beau Monde voor minder rijke (modaal of beneden modaal - variabele: inkom) en rijkere (boven modaal) vrouwen?

Nu moeten we 3 variabelen tegelijk analyseren (een multivariate analyse): de leeskans, het beroep en de rijkdom. Dan moeten we tabelsplitsing toepassen zoals we geleerd hebben bij BS. Gebruik de (dichotome) rijkdom-variabele als layer in de kruistabel. Je krijgt dan eigenlijk twee kruistabellen: één met het verband tussen leeskans en beroep voor de minder rijke vrouwen en één kruistabel met dit verband voor de rijkere vrouwen (zie hieronder).
Bij de minder rijke vrouwen maakt het beroep net geen verschil voor de leeskans van Elegance, fisher exact p = 0,075. Bij de bovenmodaal verdienende vrouwen is er helemaal geen significant effect van het beroep op de leeskans, fisher exact p = 0,257. De samenhang tussen beroep en leeskans van Elegance is dus voor minder rijke en rijkere vrouwen hetzelfde, namelijk geen.

Bij Beau Monde vinden we alleen bij de minder rijke vrouwen een verschil in leeskans tussen vrouwen met en zonder een beroep, fisher exact p = 0,004, zij het dat dit effect (zeer) zwak is (Goodman en Kruskal's tau = 0,015, p = 0,003). Bij de rijkere vrouwen is deze samenhang er niet, dus hebben we hier een interactie-effect of specificatie van het verband. De leeskans komt aanmerkelijk vaker voor bij de minder rijke vrouwen met een beroep dan bij de minder rijke vrouwen zonder beroep (gestandaardiseerd celresidu =2,2). We kunnen dus concluderen dat de leeskans van Beau Monde bij minder rijke vrouwen vaak samenvalt met het hebben van een beroep, terwijl dit voor rijkere vrouwen niet geldt. Over de oorzaken kunnen we alleen speculeren: is dit een tijdschrift voor de vrouw die sociaal hogerop wil?

Belangrijkste resultaten Beau Monde

Crosstab
Inkomensklasse dichotoom Werk hebben Total
geen werk werk
modaal of minder Leeskans Beau Monde dichotoom Geen leeskans Count 325 208 533
Expected Count 316,8 216,2 533,0
Std. Residual ,5 -,6  
Leeskans Count 12 22 34
Expected Count 20,2 13,8 34,0
Std. Residual -1,8 2,2  
Total Count 337 230 567
Expected Count 337,0 230,0 567,0
boven modaal Leeskans Beau Monde dichotoom Geen leeskans Count 125 161 286
Expected Count 123,6 162,4 286,0
Std. Residual ,1 -,1  
Leeskans Count 9 15 24
Expected Count 10,4 13,6 24,0
Std. Residual -,4 ,4  
Total Count 134 176 310
Expected Count 134,0 176,0 310,0

De bijbehorende associatiematen:
Directional Measures
Inkomensklasse dichotoom Value Asymp. Std. Errora Approx. Tb Approx. Sig.
modaal of minder Nominal by Nominal Lambda Symmetric ,038 ,021 1,719 ,086
Leeskans Beau Monde dichotoom Dependent ,000 ,000 .c .c
Werk hebben Dependent ,043 ,025 1,719 ,086
Goodman and Kruskal tau Leeskans Beau Monde dichotoom Dependent ,015 ,010   ,003d
Werk hebben Dependent ,015 ,010   ,003d
boven modaal Nominal by Nominal Lambda Symmetric ,000 ,000 .c .c
Leeskans Beau Monde dichotoom Dependent ,000 ,000 .c .c
Werk hebben Dependent ,000 ,000 .c .c
Goodman and Kruskal tau Leeskans Beau Monde dichotoom Dependent ,001 ,004   ,556d
Werk hebben Dependent ,001 ,004   ,556d
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
c. Cannot be computed because the asymptotic standard error equals zero.
d. Based on chi-square approximation

e. Volgens CBS-gegevens bestond de Nederlandse bevolking rond 2000 voor 49,5% uit mannen en 50,5% vrouwen. Is de SummoScanner op dit punt representatief voor de Nederlandse bevolking?

Om deze vraag te kunnen beantwoorden, moeten we eerst weer de mannen toevoegen, die we voor de voorgaande analyses hebben weggelaten. Verder is het belangrijk om te controleren of er geen rare codes voorkomen bij de sekse variabele, die er overigens niet blijken te zijn. Bovendien weten we dan de volgorde van de mannen en vrouwen als categorieën, zodat we de percentages in de juiste volgorde kunnen invoeren in het commando om de chikwadraattoets uit te voeren.
Er blijkt een significant resultaat te zijn, chikwadraat (1) = 27,77, p < 0,001. Onder de respondenten van de SummoScanner in dit jaar zitten significant meer vrouwen (56,8%) dan in de Nederlandse bevolking (50,5%).
Dit hoeft niet te betekenen dat de resultaten bij vragen a tot en met d niet gelden voor de Nederlandse vrouwen. Het kan nog steeds zijn dat de ondervraagde vrouwen op alle punten representatief zijn voor de Nederlandse vrouwen in 1998. Maar we hebben wel reden om daaraan te twijfelen omdat de steekproef hoogstwaarschijnlijk niet netjes aselect getrokken is danwel dat niet alle respondenten dezelfde kans hadden om de vragenlijst in te vullen (selectieve nonrespons). Want dan zou de steekproef ook qua sekse representatief geweest moeten zijn.
In de praktijk wordt een niet-representatieve steekproef vaak gewogen: hier zouden de mannen iets zwaarder gewogen worden om toch tot de landelijke 49,5% - 50,5% verdeling te komen. Dit gaat het bestek van de cursus IS echter te buiten.

Alternatief: voer een t-toets op één proportie uit, want de steekproef is groot genoeg (N ∙ π0 > 5 en N ∙ (1 - π0) > 5).
Ook deze toets levert een significant resultaat met p < 0,001.

Syntax

*Syntax bij oefening 4_3.

*Opgave a.
*Controleer de leeskansvariabelen eerst.
FREQUENCIES
  VARIABLES=lkele lkbmo
  /ORDER= ANALYSIS .
*Er zijn geen rare waarden.
*Dichotomiseren van leeskans.
RECODE
  lkele lkbmo
  (0=0) (ELSE=1) INTO llkeleHER lkbmoHER .
VARIABLE LABELS llkeleHER
  'Leeskans Elegance dichotoom' /lkbmoHER 'Leeskans Beau Monde dichotoom'.
EXECUTE .
*Define Variable Properties.
*llkeleHER.
VALUE LABELS llkeleHER
     0 'Geen leeskans'
     1 'Leeskans' .
*lkbmoHER.
VALUE LABELS lkbmoHER
     0 'Geen leeskans'
     1 'Leeskans' .
EXECUTE.
*Vrouwen selecteren.
USE ALL.
COMPUTE filter_$=(gesl = 2).
VARIABLE LABEL filter_$ 'gesl = 2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
*Kruistabel leeskans Elegance en Beau Monde.
CROSSTABS
  /TABLES=llkeleHER BY lkbmoHER
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ PHI
  /CELLS= COUNT EXPECTED SRESID
  /COUNT ROUND CELL .

*Opgave b.
*Hercoderen wel/niet werkzaam zijn (en missing values voor 'No answer').
EXECUTE .
RECODE
  werkz
  (1=1) (2 thru 4=0) (ELSE=SYSMIS) INTO werkzHER .
VARIABLE LABELS werkzHER 'Werk hebben'.
EXECUTE .
*Define Variable Properties.
*werkzHER.
VALUE LABELS werkzHER
     0 'geen werk'
     1 'werk' .
EXECUTE.
*Kruistabel leeskansen naar wel/niet beroepsmatig werkzaam zijn.
CROSSTABS
  /TABLES=llkeleHER lkbmoHER BY werkzHER
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ PHI LAMBDA
  /CELLS= COUNT EXPECTED SRESID
  /COUNT ROUND CELL .

*Opgave c.
*Hercoderen inkomensklasse.
RECODE
  inkom
  (3=2) (1 thru 2=1) (ELSE=SYSMIS) INTO inkomHER .
VARIABLE LABELS inkomHER 'Inkomensklasse dichotoom'.
EXECUTE .
*Define Variable Properties.
*inkomHER.
VALUE LABELS inkomHER
     1 'modaal of minder'
     2 'boven modaal' .
EXECUTE.
*Kruistabel leeskansen naar wel/niet rijk zijn.
CROSSTABS
  /TABLES=llkeleHER lkbmoHER BY inkomHER
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ PHI LAMBDA
  /CELLS= COUNT EXPECTED SRESID
  /COUNT ROUND CELL .

*Opgave d.
*Tabelsplitsing.
CROSSTABS
  /TABLES=llkeleHER lkbmoHER BY werkzHER BY inkomHER
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ PHI LAMBDA
  /CELLS= COUNT EXPECTED SRESID
  /COUNT ROUND CELL .

*Opgave e.
*Toevoegen mannen en controleren sekse variabele.
FILTER OFF.
USE ALL.
EXECUTE.
FREQUENCIES VARIABLES=gesl
  /ORDER=ANALYSIS.
*chikwadraattoets op één variabele.
NPAR TESTS
  /CHISQUARE=gesl
  /EXPECTED=49.5 50.5
  /MISSING ANALYSIS.
*Alternatief: toets op één proportie.
*Nonparametric Tests: One Sample.
NPTESTS
   /ONESAMPLE TEST (gesl) BINOMIAL(TESTVALUE=0.495 SUCCESSCATEGORICAL=LIST(1)
   SUCCESSCONTINUOUS=CUTPOINT(MIDPOINT))
   /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
   /CRITERIA ALPHA=0.05 CILEVEL=95.