Antwoord bij Oefening 6.2e
a. Toets de hypothese dat vrouwen evenveel kans hebben om Beau Monde te lezen als Elegance. Interpreteer alle output van de bootstrap-procedure.
We moeten de twee leeskansen hier als afhankelijke waarnemingen of steekproeven beschouwen: ze meten ongeveer hetzelfde (de kans om een glossy damesblad te lezen) bij dezelfde groep respondenten. Dan kunnen we de t-toets voor gepaarde waarnemingen toepassen en daarbij te bootstrappen.
Vergeet niet om eerst de vrouwen te selecteren!
Paired Samples Statistics |
  |
Statistic |
Bootstrapa |
Bias |
Std. Error |
95% Confidence Interval |
Lower |
Upper |
Pair 1 |
Leeskans Beau Monde |
Mean |
.0310 |
.0000 |
.0043 |
.0229 |
.0399 |
N |
987 |
  |
  |
  |
  |
Std. Deviation |
.13459 |
-.00038 |
.01124 |
.11174 |
.15611 |
Std. Error Mean |
.00428 |
  |
  |
  |
  |
Leeskans Elegance |
Mean |
.0526 |
.0000 |
.0046 |
.0438 |
.0617 |
N |
987 |
  |
  |
  |
  |
Std. Deviation |
.14415 |
-.00039 |
.00862 |
.12675 |
.16070 |
Std. Error Mean |
.00459 |
  |
  |
  |
  |
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples
|
|
De eerste tabel geeft de bootstrapresultaten voor de afzonderlijke variabelen. De gemiddelde leeskans van Beau Monde blijkt een 95%-betrouwbaarheidsinterval te hebben dat ligt tussen 0,02 en 0,04 (5000 bootstrapsteekproeven). De leeskans is significant (α = 0,05) hoger dan 0, wat ons niet hoeft te verbazen want er zal toch wel iemand zijn die het blad leest.
Het gemiddelde van de bootstrapgemiddelden, dus de verwachte waarde van de bootstrapverdeling, blijkt vrijwel exact gelijk aan het gemiddelde in de steekproef want de bias is (afgerond) 0,0000 (dus kleiner dan 0,00005). Bij de standaardafwijking is het gemiddelde van alle standaardafwijkingen in de bootstrap een klein beetje lager dan de standaardafwijking in de steekproef (bias = -0,00038). De geschatte standaardfout van het gemiddelde is 0,0043.
Voor de leeskans van Elegance is een vergelijkbaar verhaal te houden, maar erg interessant zijn deze resultaten niet.
Paired Samples Correlations |
  |
N |
Correlation |
Sig. |
Bootstrap for Correlationa |
Bias |
Std. Error |
95% Confidence Interval |
Lower |
Upper |
Pair 1 |
Leeskans Beau Monde & Leeskans Elegance |
987 |
.141 |
.000 |
-.001 |
.048 |
.051 |
.238 |
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples
|
|
De correlatie tussen de twee leeskansen is niet erg hoog (r = 0,14, 95%CI[0,05; 0,24] bootstrap) maar wel significant (p < 0,001).
De correlatie in de steekproef is iets hoger dan de geschatte correlatie in de populatie op grond van de bootstrap (bias = -0,001). De geschatte standaardfout van de correlatie is 0,05.
Paired Samples Test |
  |
Paired Differences |
t |
df |
Sig. (2-tailed) |
Mean |
Std. Deviation |
Std. Error Mean |
95% Confidence Interval of the Difference |
Lower |
Upper |
Pair 1 |
Leeskans Beau Monde - Leeskans Elegance |
-.02157 |
.18284 |
.00582 |
-.03299 |
-.01015 |
-3.706 |
986 |
.000 |
|
De derde tabel is de gewone tabel met de resultaten van de t-toets. Met de informatie uit deze tabel kunnen we op de gebruikelijke manier de effectgrootte uitrekenen: d = |MV - μ0| / sV = 0,022 / 0,183 = 0,120.
De leeskans van Elegance is gemiddeld 0,02 hoger dan de leeskans van Beau Monde, t (986) = 3,706, p < 0,001, 95%CI[-0,03; -0,01], d = 0,12. Dit is een klein effect.
Bootstrap for Paired Samples Test |
  |
Mean |
Bootstrapa |
Bias |
Std. Error |
Sig. (2-tailed) |
95% Confidence Interval |
Lower |
Upper |
Pair 1 |
Leeskans Beau Monde - Leeskans Elegance |
-.02157 |
.00006 |
.00579 |
.001 |
-.03286 |
-.01021 |
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples
|
|
De bootstraptoets geeft vrijwel identieke resultaten met een iets hogere overschrijdingskans (p = 0,001 bootstrap) en, op twee decimale afgerond, hetzelfde betrouwbaarheidsinterval. Het populatiegemiddelde wordt geschat op -0,02157 + 0,00006 = -0,02163. Afgerond op twee decimalen blijft dat overigens -0,02, net als in de steekproef.
Omdat de steekproef zo groot is, heeft de toch wel forse scheefheid van de leeskansen geen noemenswaardig vertekenend effect meer op de resultaten van de t-toets. Dat is een plausibele conclusie op grond van de uitkomst dat de bootstrapmethode vrijwel identieke resultaten oplevert als de t-toets.
b. Is de leeskans van Elegance en Beau Monde gelijk voor werkende en niet-werkende vrouwen (variabele WERKZ)?
We moeten nu twee verschillende groepen vergelijken: werkende en niet-werkende vrouwen. Dan moeten we een t-toets op onafhankelijke steekproeven uitvoeren met bootstrappen. We voeren twee t-toetsen uit, één met de leeskans van Elegance als afhankelijke variabele en één met de leeskans van Beau Monde als afhankelijke variabele.
Vergeet niet om de variabele WERKZ te controleren. Je blijkt de categorieën te moeten hercoderen (groeperen): alle niet-werkenden moeten samengenomen worden.
Group Statistics |
  |
Werk hebben |
Statistic |
Bootstrapa |
  |
Bias |
Std. Error |
95% Confidence Interval |
  |
Lower |
Upper |
Leeskans Elegance |
.00 geen werk |
N |
541 |
  |
  |
  |
  |
Mean |
.0500 |
.0000 |
.0063 |
.0383 |
.0627 |
Std. Deviation |
.14809 |
-.00061 |
.01283 |
.12199 |
.17230 |
Std. Error Mean |
.00637 |
  |
  |
  |
  |
1.00 werk |
N |
446 |
  |
  |
  |
  |
Mean |
.0557 |
.0001 |
.0067 |
.0429 |
.0692 |
Std. Deviation |
.13932 |
-.00033 |
.01066 |
.11810 |
.15984 |
Std. Error Mean |
.00660 |
  |
  |
  |
  |
Leeskans Beau Monde |
.00 geen werk |
N |
541 |
  |
  |
  |
  |
Mean |
.0212 |
.0000 |
.0048 |
.0123 |
.0310 |
Std. Deviation |
.11174 |
-.00127 |
.01577 |
.07885 |
.13980 |
Std. Error Mean |
.00480 |
  |
  |
  |
  |
1.00 werk |
N |
446 |
  |
  |
  |
  |
Mean |
.0429 |
.0000 |
.0075 |
.0290 |
.0583 |
Std. Deviation |
.15726 |
-.00095 |
.01610 |
.12401 |
.18745 |
Std. Error Mean |
.00745 |
  |
  |
  |
  |
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples
|
|
Independent Samples Test |
  |
Levene's Test for Equality of Variances |
t-test for Equality of Means |
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference |
Lower |
Upper |
Leeskans Elegance |
Equal variances assumed |
.881 |
.348 |
-.620 |
985 |
.535 |
-.00572 |
.00922 |
-.02382 |
.01238 |
Equal variances not assumed |
  |
  |
-.624 |
967.989 |
.533 |
-.00572 |
.00917 |
-.02371 |
.01227 |
Leeskans Beau Monde |
Equal variances assumed |
24.355 |
.000 |
-2.520 |
985 |
.012 |
-.02163 |
.00858 |
-.03848 |
-.00478 |
Equal variances not assumed |
  |
  |
-2.441 |
781.023 |
.015 |
-.02163 |
.00886 |
-.03903 |
-.00424 |
|
Bootstrap for Independent Samples Test |
  |
Mean Difference |
Bootstrapa |
Bias |
Std. Error |
Sig. (2-tailed) |
95% Confidence Interval |
Lower |
Upper |
Leeskans Elegance |
Equal variances assumed |
-.00572 |
-.00006 |
.00920 |
.529 |
-.02409 |
.01248 |
Equal variances not assumed |
-.00572 |
-.00006 |
.00920 |
.529 |
-.02409 |
.01248 |
Leeskans Beau Monde |
Equal variances assumed |
-.02163 |
-.00004 |
.00900 |
.017 |
-.03941 |
-.00443 |
Equal variances not assumed |
-.02163 |
-.00004 |
.00900 |
.019 |
-.03941 |
-.00443 |
a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples
|
|
Ook bij deze toets vinden we geen noemenswaardige verschillen tussen de resultaten van de t-toetsen en de uitkomsten van het bootstrappen. Daarom is het voldoende om de resulatten van de t-toetsen te rapporteren op de gebruikelijke manier.
Bij Elegance vinden we geen significant verschil in de leeskans tussen werkende en niet-werkende vrouwen, t (985) = -0,62, p = 0,535, 95%CI[-0,02; 0,01]. Voor een eenzijdige toets, namelijk wanneer je uitsluit dat de bladen juist meer door niet-werkende vrouwen worden gelezen, moet je de overschrijdingskans halveren. Die is dan p = 0,267, dus ook niet significant.
Een significant verschil vinden we echter wel bij Beau Monde, t (781,02) = -2,44, p = 0,015, d = 0,16. Beau Monde heeft een grotere leeskans bij de werkzame vrouwen (M = 0,04, 95%CI[0,03; 0,06] bootstrap, SD = 0,16) dan bij niet-werkzame vrouwen (M = 0,02, 95%CI[0,01; 0,03] bootstrap, SD = 0,11). Het effect is klein.
De berekening van de effectgrootte voor Beau Monde:
c. Hangt de leeskans van Elegance en Beau Monde samen met de leeftijd van de vrouw (variabele LFNUM1)?
Controleer eerst de variabele LFNUM1. Hier zitten geen vreemde leeftijden tussen.
Voer een toets uit op de correlatie tussen enerzijds leeftijd en anderzijds de twee leeskansvariabelen.
Correlations |
  |
Leeftijd |
Leeskans Elegance |
Leeskans Beau Monde |
Leeftijd |
Pearson Correlation |
1 |
.074* |
-.097** |
Sig. (2-tailed) |
  |
.020 |
.002 |
N |
987 |
987 |
987 |
Bootstrapa |
Bias |
0 |
.000 |
.000 |
Std. Error |
0 |
.032 |
.027 |
95% Confidence Interval |
Lower |
1 |
.009 |
-.146 |
Upper |
1 |
.135 |
-.043 |
Leeskans Elegance |
Pearson Correlation |
.074* |
1 |
.141** |
Sig. (2-tailed) |
.020 |
  |
.000 |
N |
987 |
987 |
987 |
Bootstrapa |
Bias |
.000 |
0 |
.000 |
Std. Error |
.032 |
0 |
.049 |
95% Confidence Interval |
Lower |
.009 |
1 |
.049 |
Upper |
.135 |
1 |
.246 |
Leeskans Beau Monde |
Pearson Correlation |
-.097** |
.141** |
1 |
Sig. (2-tailed) |
.002 |
.000 |
  |
N |
987 |
987 |
987 |
Bootstrapa |
Bias |
.000 |
.000 |
0 |
Std. Error |
.027 |
.049 |
0 |
95% Confidence Interval |
Lower |
-.146 |
.049 |
1 |
Upper |
-.043 |
.246 |
1 |
*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed). a. Unless otherwise noted, bootstrap results are based on 5000 bootstrap samples
|
|
Beide leeskansen zijn significant verbonden met de leeftijd van de vrouw: de leeskans van Elegance is zwak positief gecorreleerd met leeftijd, r = 0,07, p < 0,05, 95%CI[0,01; 0,14] (bootstrap), terwijl de leeskans van Beau Monde juist zwak negatief gecorreleerd is met leeftijd, r = -0,10, p < 0,01, 95%CI[-0,15; -0,04] (bootstrap).
Met andere woorden: oudere vrouwen hebben wat meer kans om Elegance te lezen maar minder kans om Beau Monde te lezen.
Syntax
*Syntax bij Oefening 6_2e.
*Opgave a.
*Controleer de leeskansvariabelen eerst.
FREQUENCIES
VARIABLES=lkele lkbmo
/ORDER= ANALYSIS .
*Er zijn geen rare waarden.
*Vrouwen selecteren.
USE ALL.
COMPUTE filter_$=(gesl = 2).
VARIABLE LABEL filter_$ 'gesl = 2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
*t-toets met bootstrap.
BOOTSTRAP
/SAMPLING METHOD=SIMPLE
/VARIABLES INPUT=lkele lkbmo
/CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
/MISSING USERMISSING=EXCLUDE.
T-TEST PAIRS=lkbmo WITH lkele (PAIRED)
/CRITERIA=CI(.9500)
/MISSING=ANALYSIS.
*Opgave b.
*Hercoderen wel/niet werkzaam zijn (en missing values voor 'No answer').
RECODE
werkz
(1=1) (2 thru 4=0) (ELSE=SYSMIS) INTO werkzHER .
VARIABLE LABELS werkzHER 'Werk hebben'.
EXECUTE .
*Define Variable Properties.
*werkzHER.
VALUE LABELS werkzHER
0 'geen werk'
1 'werk' .
EXECUTE.
*t-toets met bootstrap.
BOOTSTRAP
/SAMPLING METHOD=SIMPLE
/VARIABLES TARGET=lkele lkbmo INPUT=werkzHER
/CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
/MISSING USERMISSING=EXCLUDE.
T-TEST GROUPS=werkzHER(0 1)
/MISSING=ANALYSIS
/VARIABLES=lkele lkbmo
/CRITERIA=CI(.95).
*Opgave c.
*Controleren leeftijd.
FREQUENCIES VARIABLES=lfnum1
/ORDER=ANALYSIS.
*Correlatie met bootstrap.
BOOTSTRAP
/SAMPLING METHOD=SIMPLE
/VARIABLES INPUT=lfnum1 lkele lkbmo
/CRITERIA CILEVEL=95 CITYPE=PERCENTILE NSAMPLES=5000
/MISSING USERMISSING=EXCLUDE.
CORRELATIONS
/VARIABLES=lfnum1 lkele lkbmo
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.