Antwoord bij oefening 7.2

1. Volgens een onderzoeker is het vertrouwen in de media (schaalvariabele V27) bij alle volwassen Nederlanders neutraal, dat wil zeggen gelijk aan het midden van de schaal. Formuleer de nulhypothese bij deze uitspraak en toets deze. Gebruik een significantieniveau van 5%. Interpreteer de resultaten en rapporteer ze volgens de richtlijnen van het vak Inferentiële Statistiek (APA6).

Controleer de variabele: er zijn geen onmogleijke waarden; de scores lopen netjes van 1 tot 9.
Nulhypothese: het gemiddelde vertrouwen in de media is 5,0 in de populatie van alle stemgerechtigde Nederlanders. Oftewel: H0: μvertrouwen = 5.
NB 5,0 is het midden tussen 1 en 9 op de schaal
Kies de juiste t-toets (one sample) en daarbij de juiste variabele en toetswaarde.

Interpretatie:
- Noem het gemiddelde en de standaarddeviatie in de steekproef.
- Noem de naam van de toets en het toetsresultaat: de waarde van t, de vrijheidsgraden en het significantieniveau.
- Bereken de effectgrootte:

Bijvoorbeeld: "Uit een t-toets blijkt dat het vertrouwen in de media (M = 5,12; SD = 1,42) in de populatie van alle volwassen Nederlanders significant maar weinig hoger is dan vijf en vermoedelijk ligt tussen 5,05 en 5,19, t (1549) = 3,30, p = 0,001, 95% CI [5,05, 5,19], d = 0,08."
Let op: het betrouwbaarheidsinterval dat SPSS geeft hoort bij het verschil met de waarde volgens de nulhypothese: het populatiegemiddelde wordt dus geschat op 5 plus 0,05 tot 0,19.
Geef een expliciet antwoord op de hypothese: "De nulhypothese wordt verworpen. Met 95% zekerheid kunnen we concluderen dat het vertrouwen binnen de populatie hoger is dan 5."

2. Ga na of je het vertrouwen in de media kunt verklaren op grond van geslacht (v1), opleiding (v2) en partij waarop men zou stemmen (v33 gebruik ook de categorie 'weet het niet'). Motiveer de keuze van de analysetechniek en formuleer de nulhypothese(n). Interpreteer alle relevante resultaten zoals voorgeschreven is in het vak Inferentiële Statistiek (APA6).

Controle van de variabelen geslacht, opleiding en politieke partij: bij de laatste variabele moet de waarde '13' missing worden.
NB de afhankelijke variabele 'vertrouwen in de media' is al bij vraag 1 gecontroleerd.

Motivatie keuze analysetechniek: een meerwegs-variantieanalyse want er is sprake van meer dan één onafhankelijke variabelen die allemaal categorisch zijn (geslacht, opleiding, partij) en een numerieke afhankelijke variabele (schaal vertrouwen in de media).

Rapportage variantieanalyse:
- Toon de samenvattende tabel met de resultaten van de variantieanalyse of vermeld de ze resultaten in je interpretatie.

Tests of Between-Subjects Effects
Dependent Variable:Vertrouwen in de nieuwsmedia
Source Type III Sum of Squares df Mean Square F Sig.
Corrected Model 435,196a 108 4,030 2,168 ,000
Intercept 14014,031 1 14014,031 7541,536 ,000
v1 7,859 1 7,859 4,229 ,040
v2 40,583 6 6,764 3,640 ,001
v33 71,724 7 10,246 5,514 ,000
v1 * v2 7,480 6 1,247 ,671 ,673
v1 * v33 14,080 7 2,011 1,082 ,372
v2 * v33 138,740 42 3,303 1,778 ,002
v1 * v2 * v33 79,950 39 2,050 1,103 ,306
Error 2638,710 1420 1,858    
Total 43235,328 1529      
Corrected Total 3073,906 1528      
a. R Squared = ,142 (Adjusted R Squared = ,076)

- Vermeld het soort variantieanalyse dat je hebt uitgevoerd (een meerwegs-variantieanalyse voor onafhankelijke waarnemingen).
- Vermeld voor elk significant effect het toetsresultaat en maak duidelijk wat de eenheden (Nederlandse volwassenen) en variabelen in het onderzoek zijn. Bijvoorbeeld: Zowel het geslacht, F (1, 1420) = 4,23, p = 0,040, η2 = [SSV1 / SSt = 7,859 / 3073,906 =] 0,00, het soort opleiding, F (6, 1420) = 3,64, p = 0,001, η2 = [SSV2 / SSt = 40,583 / 3073,906 =] 0,01, als de politieke partij waarop men zou stemmen, F (7, 1420) = 5,51 p < 0,001, η2 = [SSV33 / SSt = 71,724 / 3073,906 =] 0,02, heeft een significant effect op het vertrouwen in de media van volwassen Nederlanders; deze effecten zijn zeer zwak tot middelmatig. Daarnaast is er een significant, middelmatig sterk interactie-effect gevonden tussen opleiding en politieke partij, F (42, 1420) = 1,78 p = 0,002, η2 = (SSV2xV33 / SSt = 138,74 / 3073,906 =) 0,05.
- Vermeld tussen welke groepsgemiddelden er significante verschillen gevonden zijn (o.a. in de post-hoc toets) en wat de bijbehorende gemiddelde scores en standaarddeviaties in de steekproef zijn: vrouwen hebben een iets hoger vertrouwen in de media (M = 5,20; SD = 1,35) dan mannen (M = 5,05; SD = 1,48).
De meervoudige vergelijkingentoets toont dat mensen met een MAVO-opleiding meer vertrouwen hebben (M = 5,73; SD = 1,42) dan mensen met een HAVO (M = 5,15; SD = 1,42), VWO (M = 5,15; SD = 1,35) , HBO (M = 5,08; SD = 1,36) of universitaire opleiding (M = 4,75; SD = 1,45).
Mensen die op de LPF of Wilders zouden stemmen hebben meer vertrouwen in de media (M = 6,29; SD = 1,29) dan stemmers van de grote centrumpartijen CDA/CU/SGP (M = 5,33; SD = 1,32), PvdA (M = 5,23; SD = 1,40) en VVD (M = 5,15; SD = 1,42), die weer meer vertrouwen hebben in de media dan D66- of niet-stemmers (M = 4,46; SD = 1,45).
De inhoud van het interactie-effect tusen politieke voorkeur en opleiding is onduidelijk, al lijken bijvoorbeeld de GroenLinks-stemmers met alleen lager onderwijs erg weinig vertrouwen te hebben en universitair opgeleide LPF/Wilders-stemmers extra veel (zie het lijndiagram).

NB de groepen zijn niet allemaal even groot en de toets op gelijke varianties is net significant, F (108, 1420) = 1,28, p = 0,033, dus er is niet voldaan aan de voorwaarden voor een variantieanalyse.

3. Voorspel het vertrouwen dat volwassen Nederlanders hebben in de media op grond van hun leeftijd (v3), het aantal uren dat ze werken (v4uur) en het aantal uren dat zij per week televisiekijken (v5sqrt geeft de wortel van het aantal uren). Motiveer de keuze van de analysetechniek. Interpreteer alle relevante resultaten zoals voorgeschreven is in het werkboek.

Motivatie meervoudige regressieanalyse: numerieke afhankelijke variabele (vertrouwen in de media) en meer dan 1 onafhankelijke variabele, waarvan minstens 1 numeriek is (anders kan variantieanalyse).

Controle van variabelen:
- waarden van de 3 onafhankelijke variabelen: geen problemen.
- spreidingsdiagrammen van vertrouwen bij leeftijd, werktijd en televisiekijktijd: geen duidelijk krom verband.

Resultaten van de meervoudige regressieanalyse:
Het regressiemodel is significant, F (3, 1307) = 7,45, p < 0,001, maar verklaart slechts 1,7% (R2 = 0,017) procent van de variantie in het vertrouwen in de media.
- Leeftijd, b = -0,002, t = -0,91, p = 0,362, 95% CI [-0,008, 0,003], en het aantal uren dat men werkt, b = -0,003, t = -1,16, p = 0,248, 95% CI [-0,008, 0,002], hebben geen significante effecten op het vertrouwen dat volwassen Nederlanders hebben in de media.
- Het aantal uren dat men per week televisie kijkt heeft wel een zwak maar significant positief effect, b = 0,14, t = 4,28, p < 0,001, 95% CI [0,08, 0,21]: mensen die meer televisie kijken hebben meer vertrouwen in de media.
NB het is lastig om de ongestandaardiseerde regressiecoëfficiënt (b) hier te interpreteren omdat de onafhankelijke variabele de wortel uit het aantal uren televisiekijken geeft.

Model Summaryb
Model R R Square Adjusted R Square Std. Error of the Estimate
1 ,130a ,017 ,015 1,41258
a. Predictors: (Constant), Aantal uren tv kijken per week (wortel), Hoe oud bent u?, Hoeveel uur werkt u gemiddeld per week?
b. Dependent Variable: Vertrouwen in de nieuwsmedia

ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 44,588 3 14,863 7,449 ,000a
Residual 2607,971 1307 1,995    
Total 2652,559 1310      
a. Predictors: (Constant), Aantal uren tv kijken per week (wortel), Hoe oud bent u?, Hoeveel uur werkt u gemiddeld per week?
b. Dependent Variable: Vertrouwen in de nieuwsmedia

Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients t Sig. 95,0% Confidence Interval for B
B Std. Error Beta Lower Bound Upper Bound
1 (Constant) 4,711 ,171   27,498 ,000 4,375 5,047
Hoe oud bent u? -,002 ,003 -,026 -,911 ,362 -,008 ,003
Hoeveel uur werkt u gemiddeld per week? -,003 ,002 -,033 -1,156 ,248 -,008 ,002
Aantal uren tv kijken per week (wortel) ,143 ,033 ,118 4,281 ,000 ,077 ,208
a. Dependent Variable: Vertrouwen in de nieuwsmedia

De residuen zijn homoscedastisch en mooi normaal verdeeld.

Syntax

*Oefening 7_2.

*Vraag 1.
*Beschrijf de variabele.
*Univariate beschrijving: Vertrouwen in de nieuwsmedia.
FREQUENCIES
  VARIABLES=V27 /FORMAT=NOTABLE
  /HISTOGRAM=NORMAL
  /ORDER= ANALYSIS .
*Toets op 1 gemiddelde.
T-TEST
  /TESTVAL = 5
  /MISSING = ANALYSIS
  /VARIABLES = V27
  /CRITERIA = CI(.95) .

*Vraag 2.
*Beschrijving sekse.
FREQUENCIES
  VARIABLES=v1
  /ORDER= ANALYSIS .
*Define Variable Properties.
*v1.
VALUE LABELS v1
   0 'vrouw'
   1 'man' .
EXECUTE.
*Beschrijving opleiding.
FREQUENCIES
  VARIABLES=v2
  /ORDER= ANALYSIS .
*Beschrijving partij waarop men zou stemmen.
FREQUENCIES
  VARIABLES=v33
  /ORDER= ANALYSIS .
*Categorie 13 missing.
*Define Variable Properties.
*v33.
MISSING VALUES v33 ( 13 ).
EXECUTE.
*variantieanalyse.
UNIANOVA
  V27 BY v1 v2 v33
  /METHOD = SSTYPE(3)
  /INTERCEPT = INCLUDE
  /POSTHOC = v2 v33 ( BONFERRONI )
  /PLOT = PROFILE( v2*v33 )
  /PRINT = HOMOGENEITY DESCRIPTIVE
  /CRITERIA = ALPHA(.05)
  /DESIGN = v1 v2 v33 v1*v2 v1*v33 v2*v33 v1*v2*v33 .

*Vraag 3.
*Beschrijven leeftijd, werktijd en tvkijktijd.
FREQUENCIES
  VARIABLES=v3 v4uur v5sqrt /FORMAT=NOTABLE
  /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN SKEWNESS SESKEW
  /HISTOGRAM NORMAL
  /ORDER= ANALYSIS .
*Bivariaat beoordelen op extreme waarden.
GRAPH
  /SCATTERPLOT(BIVAR)=v3 WITH V27
  /MISSING=LISTWISE .
GRAPH
  /SCATTERPLOT(BIVAR)=v4uur WITH V27
  /MISSING=LISTWISE .
GRAPH
  /SCATTERPLOT(BIVAR)=v5sqrt WITH V27
  /MISSING=LISTWISE .
*Uitvoeren van de regressieanalyse.
REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF CI(95) OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN
  /DEPENDENT V27
  /METHOD=ENTER v3 v4uur v5sqrt
  /SCATTERPLOT=(*ZRESID ,*ZPRED)
  /RESIDUALS HIST(ZRESID).