Antwoord bij Oefening 6.2e

a. Toets de hypothese dat vrouwen evenveel kans hebben om Beau Monde te lezen als Elegance. Interpreteer alle output van de bootstrap-procedure.

We moeten de twee leeskansen hier als afhankelijke waarnemingen of steekproeven beschouwen: ze meten ongeveer hetzelfde (de kans om een glossy damesblad te lezen) bij dezelfde groep respondenten. Dan kunnen we de t-toets voor gepaarde waarnemingen toepassen en daarbij te bootstrappen.
Vergeet niet om eerst de vrouwen te selecteren!

Paired Samples Statistics
  Statistic Bootstrapa
Bias Std. Error 95% Confidence Interval
Lower Upper
Pair 1 Leeskans Beau Monde Mean .0310 .0000 .0043 .0229 .0399
N 987        
Std. Deviation .13459 -.00038 .01124 .11174 .15611
Std. Error Mean .00428        
Leeskans Elegance Mean .0526 .0000 .0046 .0438 .0617
N 987        
Std. Deviation .14415 -.00039 .00862 .12675 .16070
Std. Error Mean .00459        
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

De eerste tabel geeft de bootstrapresultaten voor de afzonderlijke variabelen. De gemiddelde leeskans van Beau Monde blijkt een 95%-betrouwbaarheidsinterval te hebben dat ligt tussen 0,02 en 0,04 (5000 bootstrapsteekproeven). De leeskans is significant (α = 0,05) hoger dan 0, wat ons niet hoeft te verbazen want er zal toch wel iemand zijn die het blad leest.
Het gemiddelde van de bootstrapgemiddelden, dus de verwachte waarde van de bootstrapverdeling, blijkt vrijwel exact gelijk aan het gemiddelde in de steekproef want de bias is (afgerond) 0,0000 (dus kleiner dan 0,00005). Bij de standaardafwijking is het gemiddelde van alle standaardafwijkingen in de bootstrap een klein beetje lager dan de standaardafwijking in de steekproef (bias = -0,00038). De geschatte standaardfout van het gemiddelde is 0,0043.
Voor de leeskans van Elegance is een vergelijkbaar verhaal te houden, maar erg interessant zijn deze resultaten niet.

Paired Samples Correlations
  N Correlation Sig. Bootstrap for Correlationa
Bias Std. Error 95% Confidence Interval
Lower Upper
Pair 1 Leeskans Beau Monde & Leeskans Elegance 987 .141 .000 -.001 .048 .051 .238
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

De correlatie tussen de twee leeskansen is niet erg hoog (r = 0,14, 95%CI[0,05; 0,24] bootstrap) maar wel significant (p < 0,001).
De correlatie in de steekproef is iets hoger dan de geschatte correlatie in de populatie op grond van de bootstrap (bias = -0,001). De geschatte standaardfout van de correlatie is 0,05.

Paired Samples Test
  Paired Differences t df Sig. (2-tailed)
Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference
Lower Upper
Pair 1 Leeskans Beau Monde - Leeskans Elegance -.02157 .18284 .00582 -.03299 -.01015 -3.706 986 .000

De derde tabel is de gewone tabel met de resultaten van de t-toets. Met de informatie uit deze tabel kunnen we op de gebruikelijke manier de effectgrootte uitrekenen: d = |MV - μ0| / sV = 0,022 / 0,183 = 0,120.
De leeskans van Elegance is gemiddeld 0,02 hoger dan de leeskans van Beau Monde, t (986) = 3,706, p < 0,001, 95%CI[-0,03; -0,01], d = 0,12. Dit is een klein effect.

Bootstrap for Paired Samples Test
  Mean Bootstrapa
Bias Std. Error Sig. (2-tailed) 95% Confidence Interval
Lower Upper
Pair 1 Leeskans Beau Monde - Leeskans Elegance -.02157 .00006 .00579 .001 -.03286 -.01021
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

De bootstraptoets geeft vrijwel identieke resultaten met een iets hogere overschrijdingskans (p = 0,001 bootstrap) en, op twee decimale afgerond, hetzelfde betrouwbaarheidsinterval. Het populatiegemiddelde wordt geschat op -0,02157 + 0,00006 = -0,02163. Afgerond op twee decimalen blijft dat overigens -0,02, net als in de steekproef.

Omdat de steekproef zo groot is, heeft de toch wel forse scheefheid van de leeskansen geen noemenswaardig vertekenend effect meer op de resultaten van de t-toets. Dat is een plausibele conclusie op grond van de uitkomst dat de bootstrapmethode vrijwel identieke resultaten oplevert als de t-toets.

b. Is de leeskans van Elegance en Beau Monde gelijk voor werkende en niet-werkende vrouwen (variabele WERKZ)?

We moeten nu twee verschillende groepen vergelijken: werkende en niet-werkende vrouwen. Dan moeten we een t-toets op onafhankelijke steekproeven uitvoeren met bootstrappen. We voeren twee t-toetsen uit, één met de leeskans van Elegance als afhankelijke variabele en één met de leeskans van Beau Monde als afhankelijke variabele.
Vergeet niet om de variabele WERKZ te controleren. Je blijkt de categorieën te moeten hercoderen (groeperen): alle niet-werkenden moeten samengenomen worden.

Group Statistics
  Werk hebben Statistic Bootstrapa
  Bias Std. Error 95% Confidence Interval
  Lower Upper
Leeskans Elegance .00 geen werk N 541        
Mean .0500 .0000 .0063 .0383 .0627
Std. Deviation .14809 -.00061 .01283 .12199 .17230
Std. Error Mean .00637        
1.00 werk N 446        
Mean .0557 .0001 .0067 .0429 .0692
Std. Deviation .13932 -.00033 .01066 .11810 .15984
Std. Error Mean .00660        
Leeskans Beau Monde .00 geen werk N 541        
Mean .0212 .0000 .0048 .0123 .0310
Std. Deviation .11174 -.00127 .01577 .07885 .13980
Std. Error Mean .00480        
1.00 werk N 446        
Mean .0429 .0000 .0075 .0290 .0583
Std. Deviation .15726 -.00095 .01610 .12401 .18745
Std. Error Mean .00745        
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

Independent Samples Test
  Levene's Test for Equality of Variances t-test for Equality of Means
F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference
Lower Upper
Leeskans Elegance Equal variances assumed .881 .348 -.620 985 .535 -.00572 .00922 -.02382 .01238
Equal variances not assumed     -.624 967.989 .533 -.00572 .00917 -.02371 .01227
Leeskans Beau Monde Equal variances assumed 24.355 .000 -2.520 985 .012 -.02163 .00858 -.03848 -.00478
Equal variances not assumed     -2.441 781.023 .015 -.02163 .00886 -.03903 -.00424

Bootstrap for Independent Samples Test
  Mean Difference Bootstrapa
Bias Std. Error Sig. (2-tailed) 95% Confidence Interval
Lower Upper
Leeskans Elegance Equal variances assumed -.00572 -.00006 .00920 .529 -.02409 .01248
Equal variances not assumed -.00572 -.00006 .00920 .529 -.02409 .01248
Leeskans Beau Monde Equal variances assumed -.02163 -.00004 .00900 .017 -.03941 -.00443
Equal variances not assumed -.02163 -.00004 .00900 .019 -.03941 -.00443
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

Ook bij deze toets vinden we geen noemenswaardige verschillen tussen de resultaten van de t-toetsen en de uitkomsten van het bootstrappen. Daarom is het voldoende om de resulatten van de t-toetsen te rapporteren op de gebruikelijke manier.

Bij Elegance vinden we geen significant verschil in de leeskans tussen werkende en niet-werkende vrouwen, t (985) = -0,62, p = 0,535, 95%CI[-0,02; 0,01]. Voor een eenzijdige toets, namelijk wanneer je uitsluit dat de bladen juist meer door niet-werkende vrouwen worden gelezen, moet je de overschrijdingskans halveren. Die is dan p = 0,267, dus ook niet significant.
Een significant verschil vinden we echter wel bij Beau Monde, t (781,02) = -2,44, p = 0,015, d = 0,16. Beau Monde heeft een grotere leeskans bij de werkzame vrouwen (M = 0,04, 95%CI[0,03; 0,06] bootstrap, SD = 0,16) dan bij niet-werkzame vrouwen (M = 0,02, 95%CI[0,01; 0,03] bootstrap, SD = 0,11). Het effect is klein.
De berekening van de effectgrootte voor Beau Monde:

c. Hangt de leeskans van Elegance en Beau Monde samen met de leeftijd van de vrouw (variabele LFNUM1)?

Controleer eerst de variabele LFNUM1. Hier zitten geen vreemde leeftijden tussen.
Voer een toets uit op de correlatie tussen enerzijds leeftijd en anderzijds de twee leeskansvariabelen.

Correlations
  Leeftijd Leeskans Elegance Leeskans Beau Monde
Leeftijd Pearson Correlation 1 .074* -.097**
Sig. (2-tailed)   .020 .002
N 987 987 987
Bootstrapa Bias 0 .000 .000
Std. Error 0 .032 .027
95% Confidence Interval Lower 1 .009 -.146
Upper 1 .135 -.043
Leeskans Elegance Pearson Correlation .074* 1 .141**
Sig. (2-tailed) .020   .000
N 987 987 987
Bootstrapa Bias .000 0 .000
Std. Error .032 0 .049
95% Confidence Interval Lower .009 1 .049
Upper .135 1 .246
Leeskans Beau Monde Pearson Correlation -.097** .141** 1
Sig. (2-tailed) .002 .000  
N 987 987 987
Bootstrapa Bias .000 .000 0
Std. Error .027 .049 0
95% Confidence Interval Lower -.146 .049 1
Upper -.043 .246 1
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

Beide leeskansen zijn significant verbonden met de leeftijd van de vrouw: de leeskans van Elegance is zwak positief gecorreleerd met leeftijd, r = 0,07, p < 0,05, 95%CI[0,01; 0,14] (bootstrap), terwijl de leeskans van Beau Monde juist zwak negatief gecorreleerd is met leeftijd, r = -0,10, p < 0,01, 95%CI[-0,15; -0,04] (bootstrap).
Met andere woorden: oudere vrouwen hebben wat meer kans om Elegance te lezen maar minder kans om Beau Monde te lezen.

Syntax

*Syntax bij Oefening 6_2e.

*Opgave a.
*Controleer de leeskansvariabelen eerst.
FREQUENCIES
  VARIABLES=lkele lkbmo
  /ORDER= ANALYSIS .
*Er zijn geen rare waarden.
*Vrouwen selecteren.
USE ALL.
COMPUTE filter_$=(gesl = 2).
VARIABLE LABEL filter_$ 'gesl = 2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
*t-toets met bootstrap.
BOOTSTRAP
  /SAMPLING METHOD=SIMPLE
  /VARIABLES INPUT=lkele lkbmo
  /CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
  /MISSING USERMISSING=EXCLUDE.
T-TEST PAIRS=lkbmo WITH lkele (PAIRED)
  /CRITERIA=CI(.9500)
  /MISSING=ANALYSIS.

*Opgave b.
*Hercoderen wel/niet werkzaam zijn (en missing values voor 'No answer').
RECODE
    werkz
    (1=1) (2 thru 4=0) (ELSE=SYSMIS) INTO werkzHER .
VARIABLE LABELS werkzHER 'Werk hebben'.
EXECUTE .
*Define Variable Properties.
*werkzHER.
VALUE LABELS werkzHER
     0 'geen werk'
     1 'werk' .
EXECUTE.
*t-toets met bootstrap.
BOOTSTRAP
  /SAMPLING METHOD=SIMPLE
  /VARIABLES TARGET=lkele lkbmo INPUT=werkzHER
  /CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
  /MISSING USERMISSING=EXCLUDE.
T-TEST GROUPS=werkzHER(0 1)
  /MISSING=ANALYSIS
  /VARIABLES=lkele lkbmo
  /CRITERIA=CI(.95).

*Opgave c.
*Controleren leeftijd.
FREQUENCIES VARIABLES=lfnum1
  /ORDER=ANALYSIS.
*Correlatie met bootstrap.
BOOTSTRAP
  /SAMPLING METHOD=SIMPLE
  /VARIABLES INPUT=lfnum1 lkele lkbmo
  /CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
  /MISSING USERMISSING=EXCLUDE.
CORRELATIONS
  /VARIABLES=lfnum1 lkele lkbmo
  /PRINT=TWOTAIL NOSIG
  /MISSING=PAIRWISE.