Antwoord

Antwoord bij Oefening 6.2e

a. Toets de hypothese dat vrouwen evenveel kans hebben om Beau Monde te lezen als Elegance. Interpreteer alle output van de bootstrap-procedure.

We moeten de twee leeskansen hier als afhankelijke waarnemingen of steekproeven beschouwen: ze meten ongeveer hetzelfde (de kans om een glossy damesblad te lezen) bij dezelfde groep respondenten. Dan kunnen we de t-toets voor gepaarde waarnemingen toepassen en daarbij te bootstrappen.
Vergeet niet om eerst de vrouwen te selecteren!

Paired Samples Statistics

Statistic Bootstrap^a

Bias Std. Error 95% Confidence Interval

Lower Upper

Pair 1 Leeskans Beau Monde Mean .0310 .0000 .0043 .0229 .0399

N 987

Std. Deviation .13459 -.00038 .01124 .11174 .15611

Std. Error Mean .00428

Leeskans Elegance Mean .0526 .0000 .0046 .0438 .0617

N 987

Std. Deviation .14415 -.00039 .00862 .12675 .16070

Std. Error Mean .00459

a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

De eerste tabel geeft de bootstrapresultaten voor de afzonderlijke variabelen. De gemiddelde leeskans van Beau Monde blijkt een 95%-betrouwbaarheidsinterval te hebben dat ligt tussen 0,02 en 0,04 (5000 bootstrapsteekproeven). De leeskans is significant (α = 0,05) hoger dan 0, wat ons niet hoeft te verbazen want er zal toch wel iemand zijn die het blad leest.
Het gemiddelde van de bootstrapgemiddelden, dus de verwachte waarde van de bootstrapverdeling, blijkt vrijwel exact gelijk aan het gemiddelde in de steekproef want de bias is (afgerond) 0,0000 (dus kleiner dan 0,00005). Bij de standaardafwijking is het gemiddelde van alle standaardafwijkingen in de bootstrap een klein beetje lager dan de standaardafwijking in de steekproef (bias = -0,00038). De geschatte standaardfout van het gemiddelde is 0,0043.
Voor de leeskans van Elegance is een vergelijkbaar verhaal te houden, maar erg interessant zijn deze resultaten niet.

Paired Samples Correlations

N Correlation Sig. Bootstrap for Correlation^a

Bias Std. Error 95% Confidence Interval

Lower Upper

Pair 1 Leeskans Beau Monde & Leeskans Elegance 987 .141 .000 -.001 .048 .051 .238

a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

De correlatie tussen de twee leeskansen is niet erg hoog (r = 0,14, 95%CI[0,05; 0,24] bootstrap) maar wel significant (p < 0,001).
De correlatie in de steekproef is iets hoger dan de geschatte correlatie in de populatie op grond van de bootstrap (bias = -0,001). De geschatte standaardfout van de correlatie is 0,05.

Paired Samples Test

Paired Differences t df Sig. (2-tailed)

Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference

Lower Upper

Pair 1 Leeskans Beau Monde - Leeskans Elegance -.02157 .18284 .00582 -.03299 -.01015 -3.706 986 .000

De derde tabel is de gewone tabel met de resultaten van de t-toets. Met de informatie uit deze tabel kunnen we op de gebruikelijke manier de effectgrootte uitrekenen: d = |M_V - μ₀| / s_V = 0,022 / 0,183 = 0,120.
De leeskans van Elegance is gemiddeld 0,02 hoger dan de leeskans van Beau Monde, t (986) = 3,706, p < 0,001, 95%CI[-0,03; -0,01], d = 0,12. Dit is een klein effect.

Bootstrap for Paired Samples Test

Mean Bootstrap^a

Bias Std. Error Sig. (2-tailed) 95% Confidence Interval

Lower Upper

Pair 1 Leeskans Beau Monde - Leeskans Elegance -.02157 .00006 .00579 .001 -.03286 -.01021

a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

De bootstraptoets geeft vrijwel identieke resultaten met een iets hogere overschrijdingskans (p = 0,001 bootstrap) en, op twee decimale afgerond, hetzelfde betrouwbaarheidsinterval. Het populatiegemiddelde wordt geschat op -0,02157 + 0,00006 = -0,02163. Afgerond op twee decimalen blijft dat overigens -0,02, net als in de steekproef.

Omdat de steekproef zo groot is, heeft de toch wel forse scheefheid van de leeskansen geen noemenswaardig vertekenend effect meer op de resultaten van de t-toets. Dat is een plausibele conclusie op grond van de uitkomst dat de bootstrapmethode vrijwel identieke resultaten oplevert als de t-toets.

b. Is de leeskans van Elegance en Beau Monde gelijk voor werkende en niet-werkende vrouwen (variabele WERKZ)?

We moeten nu twee verschillende groepen vergelijken: werkende en niet-werkende vrouwen. Dan moeten we een t-toets op onafhankelijke steekproeven uitvoeren met bootstrappen. We voeren twee t-toetsen uit, één met de leeskans van Elegance als afhankelijke variabele en één met de leeskans van Beau Monde als afhankelijke variabele.
Vergeet niet om de variabele WERKZ te controleren. Je blijkt de categorieën te moeten hercoderen (groeperen): alle niet-werkenden moeten samengenomen worden.

Group Statistics

Werk hebben Statistic Bootstrap^a

Bias Std. Error 95% Confidence Interval

Lower Upper

Leeskans Elegance .00 geen werk N 541

Mean .0500 .0000 .0063 .0383 .0627

Std. Deviation .14809 -.00061 .01283 .12199 .17230

Std. Error Mean .00637

1.00 werk N 446

Mean .0557 .0001 .0067 .0429 .0692

Std. Deviation .13932 -.00033 .01066 .11810 .15984

Std. Error Mean .00660

Leeskans Beau Monde .00 geen werk N 541

Mean .0212 .0000 .0048 .0123 .0310

Std. Deviation .11174 -.00127 .01577 .07885 .13980

Std. Error Mean .00480

1.00 werk N 446

Mean .0429 .0000 .0075 .0290 .0583

Std. Deviation .15726 -.00095 .01610 .12401 .18745

Std. Error Mean .00745

a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

Independent Samples Test

Levene's Test for Equality of Variances t-test for Equality of Means

F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference

Lower Upper

Leeskans Elegance Equal variances assumed .881 .348 -.620 985 .535 -.00572 .00922 -.02382 .01238

Equal variances not assumed -.624 967.989 .533 -.00572 .00917 -.02371 .01227

Leeskans Beau Monde Equal variances assumed 24.355 .000 -2.520 985 .012 -.02163 .00858 -.03848 -.00478

Equal variances not assumed -2.441 781.023 .015 -.02163 .00886 -.03903 -.00424

Bootstrap for Independent Samples Test

Mean Difference Bootstrap^a

Bias Std. Error Sig. (2-tailed) 95% Confidence Interval

Lower Upper

Leeskans Elegance Equal variances assumed -.00572 -.00006 .00920 .529 -.02409 .01248

Equal variances not assumed -.00572 -.00006 .00920 .529 -.02409 .01248

Leeskans Beau Monde Equal variances assumed -.02163 -.00004 .00900 .017 -.03941 -.00443

Equal variances not assumed -.02163 -.00004 .00900 .019 -.03941 -.00443

a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

Ook bij deze toets vinden we geen noemenswaardige verschillen tussen de resultaten van de t-toetsen en de uitkomsten van het bootstrappen. Daarom is het voldoende om de resulatten van de t-toetsen te rapporteren op de gebruikelijke manier.

Bij Elegance vinden we geen significant verschil in de leeskans tussen werkende en niet-werkende vrouwen, t (985) = -0,62, p = 0,535, 95%CI[-0,02; 0,01]. Voor een eenzijdige toets, namelijk wanneer je uitsluit dat de bladen juist meer door niet-werkende vrouwen worden gelezen, moet je de overschrijdingskans halveren. Die is dan p = 0,267, dus ook niet significant.
Een significant verschil vinden we echter wel bij Beau Monde, t (781,02) = -2,44, p = 0,015, d = 0,16. Beau Monde heeft een grotere leeskans bij de werkzame vrouwen (M = 0,04, 95%CI[0,03; 0,06] bootstrap, SD = 0,16) dan bij niet-werkzame vrouwen (M = 0,02, 95%CI[0,01; 0,03] bootstrap, SD = 0,11). Het effect is klein.
De berekening van de effectgrootte voor Beau Monde:

c. Hangt de leeskans van Elegance en Beau Monde samen met de leeftijd van de vrouw (variabele LFNUM1)?

Controleer eerst de variabele LFNUM1. Hier zitten geen vreemde leeftijden tussen.
Voer een toets uit op de correlatie tussen enerzijds leeftijd en anderzijds de twee leeskansvariabelen.

Correlations

Leeftijd Leeskans Elegance Leeskans Beau Monde

Leeftijd Pearson Correlation 1 .074^* -.097^**

Sig. (2-tailed) .020 .002

N 987 987 987

Bootstrap^a Bias 0 .000 .000

Std. Error 0 .032 .027

95% Confidence Interval Lower 1 .009 -.146

Upper 1 .135 -.043

Leeskans Elegance Pearson Correlation .074^* 1 .141^**

Sig. (2-tailed) .020 .000

N 987 987 987

Bootstrap^a Bias .000 0 .000

Std. Error .032 0 .049

95% Confidence Interval Lower .009 1 .049

Upper .135 1 .246

Leeskans Beau Monde Pearson Correlation -.097^** .141^** 1

Sig. (2-tailed) .002 .000

N 987 987 987

Bootstrap^a Bias .000 .000 0

Std. Error .027 .049 0

95% Confidence Interval Lower -.146 .049 1

Upper -.043 .246 1

*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples

Beide leeskansen zijn significant verbonden met de leeftijd van de vrouw: de leeskans van Elegance is zwak positief gecorreleerd met leeftijd, r = 0,07, p < 0,05, 95%CI[0,01; 0,14] (bootstrap), terwijl de leeskans van Beau Monde juist zwak negatief gecorreleerd is met leeftijd, r = -0,10, p < 0,01, 95%CI[-0,15; -0,04] (bootstrap).
Met andere woorden: oudere vrouwen hebben wat meer kans om Elegance te lezen maar minder kans om Beau Monde te lezen.

Syntax

*Syntax bij Oefening 6_2e.

*Opgave a.
*Controleer de leeskansvariabelen eerst.
FREQUENCIES
  VARIABLES=lkele lkbmo
  /ORDER= ANALYSIS .
*Er zijn geen rare waarden.
*Vrouwen selecteren.
USE ALL.
COMPUTE filter_$=(gesl = 2).
VARIABLE LABEL filter_$ 'gesl = 2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
*t-toets met bootstrap.
BOOTSTRAP
  /SAMPLING METHOD=SIMPLE
  /VARIABLES INPUT=lkele lkbmo
  /CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
  /MISSING USERMISSING=EXCLUDE.
T-TEST PAIRS=lkbmo WITH lkele (PAIRED)
  /CRITERIA=CI(.9500)
  /MISSING=ANALYSIS.

*Opgave b.
*Hercoderen wel/niet werkzaam zijn (en missing values voor 'No answer').
RECODE
    werkz
    (1=1) (2 thru 4=0) (ELSE=SYSMIS) INTO werkzHER .
VARIABLE LABELS werkzHER 'Werk hebben'.
EXECUTE .
*Define Variable Properties.
*werkzHER.
VALUE LABELS werkzHER
     0 'geen werk'
     1 'werk' .
EXECUTE.
*t-toets met bootstrap.
BOOTSTRAP
  /SAMPLING METHOD=SIMPLE
  /VARIABLES TARGET=lkele lkbmo INPUT=werkzHER
  /CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
  /MISSING USERMISSING=EXCLUDE.
T-TEST GROUPS=werkzHER(0 1)
  /MISSING=ANALYSIS
  /VARIABLES=lkele lkbmo
  /CRITERIA=CI(.95).

*Opgave c.
*Controleren leeftijd.
FREQUENCIES VARIABLES=lfnum1
  /ORDER=ANALYSIS.
*Correlatie met bootstrap.
BOOTSTRAP
  /SAMPLING METHOD=SIMPLE
  /VARIABLES INPUT=lfnum1 lkele lkbmo
  /CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
  /MISSING USERMISSING=EXCLUDE.
CORRELATIONS
  /VARIABLES=lfnum1 lkele lkbmo
  /PRINT=TWOTAIL NOSIG
  /MISSING=PAIRWISE.