Antwoord bij Oefening 6.5

Bereken de logaritme van de leeskans van de Telegraaf zoals in de opgave is aangegeven. Wanneer je de nieuwe variabele beschrijft, zul je zien dat deze geen mooie normaalverdeling heeft.
Nadat je dummyvariabelen hebt gemaakt voor de elf omroepen, kun je ze als onafhankelijke variabelen in een meervoudige regressieanalyse stoppen. Gebruik de nieuwe variabele met de leeskans van de Telegraaf als afhankelijke variabele.
Wanneer je als methode voor stepwise kiest, voert SPSS een reeks regressieanalyses uit. Elke keer wordt de omroep toegevoegd die de leeskans van de Telegraaf het beste voorspelt. Ook kunnen eventuele omroepen verwijderd worden die eerder toegevoegd zijn maar niet langer nodig zijn omdat hun voorspellingen vervangen kunnen worden door de voorspellingen van andere omroepen in het model.
Hoe sterker het positieve effect van een omroepdummy op de leeskans van de Telegraaf, des te hoger is de gemiddelde leeskans van de Telegraaf bij degenen die het omroepblad lezen. Korter gezegd, hoe sterker het positieve effect, des te meer potentiële Telegraaflezers zitten er bij deze omroep.

De resultaten:

Variables Entered/Removeda
Model Variables Entered Variables Removed Method
1 TROSkompas . Stepwise (Criteria: Probability-of-F-to-enter <= ,050, Probability-of-F-to-remove >= ,100).
2 Televizier . Stepwise (Criteria: Probability-of-F-to-enter <= ,050, Probability-of-F-to-remove >= ,100).
3 VARA . Stepwise (Criteria: Probability-of-F-to-enter <= ,050, Probability-of-F-to-remove >= ,100).
4 Veronica . Stepwise (Criteria: Probability-of-F-to-enter <= ,050, Probability-of-F-to-remove >= ,100).
5 NCRV . Stepwise (Criteria: Probability-of-F-to-enter <= ,050, Probability-of-F-to-remove >= ,100).
a. Dependent Variable: LogLKteg

De eerste tabel laat zien dat er vijf regressieanalyses zijn uitgevoerd. Eerst is het TROS kompas als voorspeller gebruikt. Daarna is AVRO’s Televizier toegevoegd, vervolgens de VARA gids, enzovoort. Er is geen enkele keer een eerder toegevoegde omroepgids weer verwijderd: de kolom Variables Removed is leeg.

Model Summaryf
Model R R Square Adjusted R Square Std. Error of the Estimate Change Statistics
R Square Change F Change df1 df2 Sig. F Change
1 ,103a ,011 ,010 ,21246 ,011 18,663 1 1735 ,000
2 ,136b ,018 ,017 ,21167 ,008 13,860 1 1734 ,000
3 ,162c ,026 ,025 ,21089 ,008 13,879 1 1733 ,000
4 ,179d ,032 ,030 ,21031 ,006 10,587 1 1732 ,001
5 ,192e ,037 ,034 ,20986 ,005 8,496 1 1731 ,004
a. Predictors: (Constant), TROSkompas
b. Predictors: (Constant), TROSkompas, Televizier
c. Predictors: (Constant), TROSkompas, Televizier, VARA
d. Predictors: (Constant), TROSkompas, Televizier, VARA, Veronica
e. Predictors: (Constant), TROSkompas, Televizier, VARA, Veronica, NCRV
f. Dependent Variable: LogLKteg

Het model voorspelt de leeskans van de Telegraaf steeds significant beter (de F Change-toets is steeds significant), al wordt de toename in het percentage verklaarde variantie (kijk naar R Square Change) wel steeds kleiner. De totale voorspelling blijft echter zeer zwak (enkele procenten).

De tabel met de regressiecoëfficiënten is het belangrijkst. We zien hier dat alleen TROS kompas, Televizier en de Veronica gids positief samenhangen met de leeskans van de Telegraaf. De VARA gids en NCRV gids hebben een negatief effect: lezers van deze omroepbladen hebben juist een lagere leeskans bij de Telegraaf dan gemiddeld. In deze laatste twee omroepgidsen moet je je advertentie zeker niet zetten.

Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients t Sig. 95,0% Confidence Interval for B
B Std. Error Beta Lower Bound Upper Bound
1 (Constant) ,125 ,006   22,799 ,000 ,115 ,136
TROSkompas ,063 ,015 ,103 4,320 ,000 ,034 ,092
2 (Constant) ,120 ,006   21,156 ,000 ,109 ,131
TROSkompas ,058 ,015 ,095 3,971 ,000 ,029 ,087
Televizier ,065 ,017 ,089 3,723 ,000 ,031 ,099
3 (Constant) ,128 ,006   21,229 ,000 ,116 ,140
TROSkompas ,055 ,015 ,090 3,755 ,000 ,026 ,083
Televizier ,066 ,017 ,090 3,792 ,000 ,032 ,100
VARA -,056 ,015 -,088 -3,725 ,000 -,086 -,027
4 (Constant) ,116 ,007   16,422 ,000 ,102 ,130
TROSkompas ,054 ,015 ,088 3,692 ,000 ,025 ,082
Televizier ,066 ,017 ,091 3,825 ,000 ,032 ,100
VARA -,052 ,015 -,082 -3,428 ,001 -,081 -,022
Veronica ,035 ,011 ,077 3,254 ,001 ,014 ,056
5 (Constant) ,122 ,007   16,611 ,000 ,107 ,136
TROSkompas ,054 ,015 ,088 3,703 ,000 ,025 ,082
Televizier ,066 ,017 ,090 3,805 ,000 ,032 ,099
VARA -,053 ,015 -,083 -3,500 ,000 -,082 -,023
Veronica ,033 ,011 ,072 3,030 ,002 ,012 ,054
NCRV -,048 ,016 -,069 -2,915 ,004 -,080 -,016
a. Dependent Variable: LogLKteg

De laatste tabel toont gegevens over de omroepgidsen die niet in de analyse zijn opgenomen (per model). Alleen omroepgidsen met significante regressiecoëfficiënten (b) worden aan het model toegevoegd. Je ziet dat zes gidsen uiteindelijk geen significant effect hebben. Bij deze gidsen moeten we dus uitgaan van de nulhypothese dat het lezen van deze gidsen niet helpt om de leeskans van de Telegraaf te voorspellen.

Excluded Variablesf
Model Beta In t Sig. Partial Correlation Collinearity Statistics
Tolerance
1 AVRO ,024a ,996 ,319 ,024 1,000
Mikrogids -,012a -,493 ,622 -,012 ,997
NCRV -,074a -3,099 ,002 -,074 1,000
TVstudio ,021a ,888 ,375 ,021 1,000
Televizier ,089a 3,723 ,000 ,089 ,991
TVkrant ,012a ,491 ,624 ,012 ,981
VARA -,087a -3,655 ,000 -,087 ,997
Veronica ,084a 3,522 ,000 ,084 ,999
VisieEO -,051a -2,136 ,033 -,051 ,999
VPRO -,048a -2,000 ,046 -,048 ,996
2 AVRO ,015b ,627 ,531 ,015 ,989
Mikrogids -,016b -,655 ,513 -,016 ,995
NCRV -,073b -3,075 ,002 -,074 1,000
TVstudio ,017b ,704 ,482 ,017 ,997
TVkrant ,006b ,237 ,813 ,006 ,976
VARA -,088b -3,725 ,000 -,089 ,996
Veronica ,085b 3,566 ,000 ,085 ,999
VisieEO -,049b -2,041 ,041 -,049 ,999
VPRO -,043b -1,816 ,070 -,044 ,993
3 AVRO ,011c ,455 ,649 ,011 ,987
Mikrogids -,019c -,791 ,429 -,019 ,994
NCRV -,074c -3,146 ,002 -,075 1,000
TVstudio ,015c ,624 ,532 ,015 ,997
TVkrant ,007c ,271 ,786 ,007 ,976
Veronica ,077c 3,254 ,001 ,078 ,991
VisieEO -,053c -2,243 ,025 -,054 ,996
VPRO -,038c -1,608 ,108 -,039 ,990
4 AVRO ,016d ,661 ,509 ,016 ,983
Mikrogids -,019d -,785 ,433 -,019 ,994
NCRV -,069d -2,915 ,004 -,070 ,994
TVstudio ,015d ,652 ,515 ,016 ,996
TVkrant ,004d ,158 ,875 ,004 ,975
VisieEO -,046d -1,933 ,053 -,046 ,986
VPRO -,032d -1,346 ,179 -,032 ,983
5 AVRO ,014e ,602 ,547 ,014 ,983
Mikrogids -,020e -,830 ,407 -,020 ,994
TVstudio ,017e ,738 ,461 ,018 ,996
TVkrant ,006e ,234 ,815 ,006 ,974
VisieEO -,038e -1,581 ,114 -,038 ,970
VPRO -,031e -1,310 ,190 -,031 ,983
a. Predictors in the Model: (Constant), TROSkompas
b. Predictors in the Model: (Constant), TROSkompas, Televizier
c. Predictors in the Model: (Constant), TROSkompas, Televizier, VARA
d. Predictors in the Model: (Constant), TROSkompas, Televizier, VARA, Veronica
e. Predictors in the Model: (Constant), TROSkompas, Televizier, VARA, Veronica, NCRV
f. Dependent Variable: LogLKteg

Kortom, er zijn maar drie omroepgidsen die de leeskans van de Telegraaf significant en positief voorspellen: TROS kompas, Televizier en de Veronica gids. Hier kun je de advertenties het beste publiceren.

De verdeling van de residuen is niet echt normaal omdat de afhankelijke variabele ook duidelijk niet normaal verdeeld is. We moeten er rekening mee houden dat de meervoudige regressie hier niet helemaal te vertrouwen is.

We hebben hier een kwantitatieve afhankelijke variabele en alleen maar categorische (dichotome) onafhankelijke variabelen. We hadden dus ook (en misschien beter) een meerweg-variantieanalyse kunnen uitvoeren. De groepen moeten dan overigens wel gelijke varianties hebben op de onafhankelijke variabele.

Syntax

*Syntax oefening 6_5.

*Logaritme (LN) nemen van leeskans Telegraaf.
COMPUTE LogLKteg = LN(lkteg + 1) .
EXECUTE .
*Beschrijven.
FREQUENCIES VARIABLES=LogLKteg
  /FORMAT=NOTABLE
  /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN
  /HISTOGRAM NORMAL
  /ORDER=ANALYSIS.
*Dummyvariabelen voor leeskansen omroepbladen.
RECODE
  lkavr lkmik lkncr lkstk lktev lktrk lktkr lkvar lkver lkvis lkvpr
  (0=0) (ELSE=1) INTO AVRO Mikrogids NCRV TVstudio Televizier
  TROSkompas TVkrant VARA Veronica VisieEO VPRO .
EXECUTE .

*Regressieanalyse: stepwise.
REGRESSION
  /DESCRIPTIVES MEAN STDDEV CORR SIG N
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS CI(95) R ANOVA CHANGE
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN
  /DEPENDENT LogLKteg
  /METHOD=STEPWISE AVRO Mikrogids NCRV TVstudio Televizier TROSkompas TVkrant VARA Veronica VisieEO
   VPRO
  /SCATTERPLOT=(*ZRESID ,*ZPRED)
  /RESIDUALS HIST(ZRESID).