Antwoord bij rekenopgave 6.4e

a. Vul de tabellen aan.

We moeten de R en R2 voor het model met alle zes de onafhankelijke variabelen uitrekenen, de F-verschil toetsen, de F-toets op het complete model, de gestandaardiseerde regressiecoëfficiënten en de t-toetsen op de regressiecoëfficiënten.
Voor R2 en de F-toets op het complete model hebben we de kwadratensommen van het hele model nodig, dus laten we daarmee beginnen.
De totale kwadratensom SSY kunnen we afleiden uit de standaardafwijking van de afhankelijke variabele (Bezorgdheid over de euro) aangezien deze kwadratensom de teller is in de formule voor de standaardafwijking (vul Y in voor X). Kwadrateer eerst de standaardafwijking, zodat je het wortelteken kwijt raakt - je hebt nu de geschatte variantie - en vermenigvuldig vervolgens met de noemer (N - 1) om de kwadratensom te krijgen (N kun je aflezen uit de tabel met gemiddelden en standaardafwijkingen):

Aangezien de kwadratensom van de regressie gegeven is, kunnen we nu de kwadratensom van het residu eenvoudig berekenen:
SSresidu = SSY - SSregressie = 1164,772 - 77,369 = 1087,403 .
De rest van de ANOVA tabel kunnen we nu invullen zoals bij een variantie-analyse waarbij we ons moeten realiseren dat bij de vrijheidsgraden k het aantal onafhankelijke variabelen is. Dat is bij het volledige model 6.
Bij df1 = 6 en df2 = 2441 is de kritieke F-waarde bij 5% significantieniveau ongeveer 2,2 (we kijken bij df2 = 120 in de tabel: het dichtstbijzijnde lagere aantal vrijheidsgraden) en bij 1% significantieniveau is Fkrit = 3,0. Het resultaat is dus op beide niveaus significant.

ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 77,369 6 12,895 28,978 < 0,01 a
Residual 1087,403 2441 0,445    
Total 1164,772 2447      
a. Predictors: (Constant), Leeftijd, Nederland versus de overige landen, sekse, Ooit electronisch betaald, veelzijdigheid internetgebruik, Leeftijd bij einde onderwijs
b. Dependent Variable: Bezorgdheid over de euro

Het is nu eenvoudig om R2 uit te rekenen voor het hele model en de wortel daaruit: R.

Voor elke stap in de stapsgewijze regressie kunnen we nu de F-verschil waarde uitrekenen en toetsen. Let op df2, die bij elke stap 1 kleiner wordt. Bij het eerste model gaan we ervan uit dat het voorgaande model (zonder predictor) 0% van de variantie verklaart.
F-verschil voor het eerste model (de tweede berekening zorgt ervoor dat je geen heel kleine getallen overhoudt waarbij je sterk moet afronden):

en voor het tweede model:

en voor de rest van de modellen (verkort weergegeven):

De kritieke waarde van F is in alle gevallen 3,9 op 5% significantieniveau en 6,9 op 1% significantieniveau.

R2 Change is gewoon het verschil tussen de R2-en van twee opeenvolgende modellen.

Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate Change Statistics
R Square Change F Change df1 df2 Sig. F Change
1 0,157a 0,025 0,024 0,68206 0,025 62,718 1 2446 < 0,01
2 0,197b 0,039 0,038 0,67719 0,014 35,619 1 2445 < 0,01
3 0,221c 0,049 0,048 0,67381 0,010 25,699 1 2444 < 0,01
4 0,237d 0,056 0,055 0,67139 0,007 18,115 1 2443 < 0,01
5 0,255e 0,065 0,063 0,66826 0,009 23,506 1 2442 < 0,01
6 0,257f 0,066 0,064 0,66801 0,001 2,613 1 2441 n.s.
a. Predictors: (Constant), sekse
b. Predictors: (Constant), sekse, Leeftijd bij einde onderwijs
c. Predictors: (Constant), sekse, Leeftijd bij einde onderwijs, Ooit electronisch betaald
d. Predictors: (Constant), sekse, Leeftijd bij einde onderwijs, Ooit electronisch betaald, Leeftijd
e. Predictors: (Constant), sekse, Leeftijd bij einde onderwijs, Ooit electronisch betaald, Leeftijd, veelzijdigheid internetgebruik
f. Predictors: (Constant), sekse, Leeftijd bij einde onderwijs, Ooit electronisch betaald, Leeftijd, veelzijdigheid internetgebruik, Nederland versus de overige landen

Dan blijven nog de regressiecoëfficiënten over: hun standaardisering en significantie.
Gestandaardiseerde regressiecoëfficiënten krijg je door de ongestandaardiseerde regressiecoëfficiënten te vermenigvuldigen met de standaardafwijking van de onafhankelijke variabele en te delen door de standaardafwijking van de afhankelijke variabele. De standaardafwijkingen zijn gegeven, dus dit is eenvoudig:

Onder de nulhypothese dat de regressiecoëfficiënt in de populatie nul is (H0: βi = 0), is de t-waarde gelijk aan de ongestandaardiseerde regressiecoëfficiënt gedeeld door diens standaardfout.

De kritieke t-waarde is steeds 1,984 bij 5% significantieniveau en 2,626 bij 1% significantieniveau aangezien bij elke toets het aantal vrijheidsgraden N - k - 1 = 2441 is (we kijken in de tabel bij het dichtsbijzijnde lagere aantal vrijheidsgraden: 100).

Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients t Sig.
B Std. Error Beta
1 (Constant) 2,379 0,065   36,361 0,000
Nederland versus de overige landen -0,078 0,046 -0,033 -1,696 n.s.
Leeftijd bij einde onderwijs 0,009 0,003 0,072 3,000 < 0,01
sekse 0,190 0,028 0,137 6,786 < 0,01
veelzijdigheid internetgebruik 0,090 0,018 0,101 5,000 < 0,01
Ooit electronisch betaald 0,113 0,028 0,080 4,036 < 0,01
Leeftijd 0,006 0,001 0,118 6,000 < 0,01
a. Dependent Variable: Bezorgdheid over de euro

b. Trek een conclusie volgens de voorschriften van het vak IS.

We kunnen de bezorgdheid over de invoering van de euro voorspellen met een meervoudige regressiemodel, F (6, 2441) = 28,98, p < 0,01. Er blijken vijf predictoren significant bij te dragen aan de verbetering van de voorspelling en zij worden in de volgende volgorde toegevoegd: sekse, b = 0,19, t = 6,79, p < 0,01, leeftijd bij het beëindigen van full-time onderwijs, b = 0,009, t = 3,000, p < 0,01, of men electronisch betaald heeft, b = 0,113, t = 4,036, p < 0,01, leeftijd, b = 0,006, t = 6,000, p < 0,01, en internetgebruik, b = 0,090, t = 5,000, p < 0,01. In totaal voorspellen deze variabelen slechts 6 tot 7 procent van de variantie in bezorgdheid over de euro. Alleen het verschil tussen Nederland en andere landen blijkt geen significante voorspellende waarde te hebben, b = -0,078, t = -1,696, n.s..
Mannen zijn gemiddeld meer bezorgd over de euro, wat ook geldt voor mensen die langer een full-time opleiding hebben gevolgd, mensen die electronisch betaald hebben, ouder zijn en meer gebruik maken van internet. Alle effecten zijn zwak.