Antwoord bij rekenopgave 6.3e

a. Vermeld de nulhypothese en alternatieve hypothese van de toets die je moet uitvoeren om de vraag te beantwoorden.

Om na te gaan of het regressiemodel bruikbaar is om politiek cynisme te voorspellen, moet je een F-toets uitvoeren op het hele regressiemodel. De statistische hypothesen kunnen daarbij zijn:

b. Voer de toets uit en beantwoord de vraag.

Aan de tabel met de regressiecoëfficiënten kun je zien dat de effecten van sekse en leeftijd significant zijn op 5% significantieniveau, dus hun waarde in de populatie is (met 95% zekerheid) ongelijk aan nul in de populatie. Het regressiemodel zal dus ook als geheel significant zijn.
Maar goed, we moeten de toets uitvoeren.

  1. Stap 1: Specificeer de hypothesen. Zie het antwoord bij vraag a.
  2. Stap 2: Kies de kansverdeling.
    De toets op het hele regressiemodel is een F-toets, dus we gebruiken de F-verdeling als kansverdeling.
  3. Stap 3: Bepaal de kritieke waarde en het verwerpingsgebied.
    Het aantal vrijheidsgraden is: df1 = k = 4 (het aantal onafhankelijke variabelen) en df2 = N - k - 1 = 12 - 4 - 1 = 7.
    Zoek de kritieke waarde van F op in de significantietabel: Fkrit (4, 7) = 4,1 (α = 0,05, eenzijdig).
    Het verwerpingsgebied zijn dan de F-waarden 4,1 en hoger.
  4. Stap 4: Bereken de toetsingsgrootheid F voor de steekproef.
    Volgens de formule voor F hebben we de kwadratensommen van de regressie en van het residu nodig dan wel de determinatiecoëfficiënt (het kwadraat van de multipele correlatiecoëfficiënt). Om die laatste te berekenen moeten we ook de kwadratensom van de regressie of van het residu (en van Y) weten. We zullen dus kwadratensommen moeten uitrekenen.

    Voor de kwadratensom van de regressie of van het residu hebben we de voorspelde waarde van Y (dus Ŷ) nodig. Voor de kwadratensom van de regressie moeten we daar het gemiddelde van Y van aftrekken en voor de kwadratensom van het residu moeten we de voorspelde waarde aftrekken van Y zelf. Dat laatste heeft minder afrondingsproblemen (voor het gemiddelde moeten we afronden), dus berekenen we de kwadratensom van het residu en de totale kwadratensom (van Y). Wanneer we ook de kwadratensom van de regressie willen weten, trekken we het residu gewoon van het totaal af.
    De voorspelde waarde krijgen we door voor elke waarneming diens score in te vullen in de regressievergelijking. Bijvoorbeeld voor de eerste respondent: Ŷ = a + b1X1 + b2X2 + b3X3 + b4X4 = -5,514 + 0 ∙ (-1,876) + 18 ∙ 0,569 + 5,87 ∙ (-0,339) + 8,09 ∙ (-0,105) = -5,514 + 0 + 10,242 + (-1,990) + (-0,849) = 1,889 .

    De hulptabel met de benodigde gegevens:

    respsekseleeftijdpolinteressepolkennispolcynisme (Y)ŷy - ŷ(y - ŷ)2y2
    10185,878,092,121,8890,2310,0534,494
    21256,726,34,453,8950,5550,30819,803
    31222,053,145,94,1031,7973,22934,81
    40193,833,033,333,68-0,350,12311,089
    50183,417,32,252,806-0,5560,3095,063
    60242,461,66,67,14-0,540,29243,56
    71231,815,193,774,538-0,7680,5914,213
    80216,875,524,573,5261,0441,0920,885
    91204,646,941,421,688-0,2680,0722,016
    101192,56,211,831,921-0,0910,0083,349
    110185,777,962,131,9360,1940,0384,537
    121237,864,721,342,537-1,1971,4331,796
    Som    39,71  7,545165,615

    De berekeningen op grond van deze tabel (let op, de berekening via R2 is minder nauwkeurig door tussentijdse afronding):

  5. Stap 5: Ga na of de berekende waarde van de toetsingsgrootheid in het verwerpingsgebied valt:
    F = 6,18 en dus groter dan de kritieke waarde 4,1. We verwerpen dus de nulhypothese.
De vraag was of we politiek cynisme kunnen voorspellen en, zo ja, hoe goed.
Het meervoudige regressiemodel dat politiek cynisme voorspelt op grond van sekse, leeftijd, politieke interesse en politieke kennis is significant, F (4, 7) = 6,18, p < 0,05. Het blijkt mogelijk om ongeveer 78% van de verschillen tussen respondenten qua politiek cynisme te voorspellen op grond van hun sekse, leeftijd, politieke interesse en politieke kennis.