Antwoord bij oefening 1.5

I - Schaalconstructie: vormen de variabelen v21 tot en met v31 een eendimensionale schaal?

a. Beschrijf de variabelen v21 tot en met v31: maak univariate tabellen of grafieken.
Omdat het hier gaat om variabelen met een beperkt aantal antwoordmogelijkheden (waarden), kunnen er overzichtelijke frequentietabellen gemaakt worden. Dit heeft als voordeel dat we de waarden zien. Omdat de variabelen minstens op ordinaal niveau gemeten zijn, kunnen er ook staafdiagrammen gemaakt worden of boxplots. Met negen antwoordmogelijkheden mag de variabele als interval meetniveau gezien worden; een histogram kan dan ook gemaakt worden. Zie BS.

b. Bewerk de variabelen indien nodig: voeg labels toe aan de variabelen en waarden, definieer onmogelijke of irrelevante waarden als missing values.
Uit de beschrijving wordt duidelijk dat er bij v24 een onmogelijke waarde voorkomt: '78'. Waarschijnlijk een typefout bij het invoeren. Markeer deze waarde als een missing value. Waarschijnlijk is de juiste waarde 7 of 8, maar dat weten we niet zeker.

c. Voer een principale-componenten-factoranalyse uit met de variabelen en rapporteer de resultaten zoals voorgeschreven in MCO/BS. Voeg de schaalscores van de principale-componenten-factoranalyse als nieuwe variabele(n) toe aan het databestand.
Kijk eerst naar de tabel met de eigenwaarden en het scree plot. Volgens allebei de criteria zijn er 2 belangrijke factoren: 2 factoren hebben een eigenwaarde boven de 1 en na de tweede factor is er een duidelijke knik in het scree plot.
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
1 4,077 37,067 37,067 4,077 37,067 37,067 3,742 34,022 34,022
2 2,601 23,645 60,712 2,601 23,645 60,712 2,936 26,690 60,712
3 ,895 8,135 68,847





4 ,758 6,890 75,737





5 ,553 5,023 80,761





6 ,500 4,548 85,309





7 ,426 3,872 89,180





8 ,372 3,384 92,564





9 ,326 2,967 95,532





10 ,281 2,556 98,087





11 ,210 1,913 100,000





Extraction Method: Principal Component Analysis.

De betekenis van de twee factoren moet afgelezen worden uit de (geroteerde) factorlading matrix (zie hieronder). Het is duidelijk dat de eerste factor bepaald wordt door meningen over de betrouwbaarheid van het nieuws (variabelen v27 - v31) terwijl de tweede factor bepaald wordt door de motieven om over het nieuws te praten (variabelen v21 - v26).
Rotated Component Matrix(a)

Component
1 2
Hoe vaak praat u over onderwerpen uit het nieuws- om nieuwe informatie te krijgen ,114 ,621
Hoe vaak praat u over onderwerpen uit het nieuws- om de mening van anderen te weten te komen ,025 ,819
Hoe vaak praat u over onderwerpen uit het nieuws- om te horen of ze dezelfde mening hebben als ik ,121 ,738
Hoe vaak praat u over onderwerpen uit het nieuws- om nieuwe argumenten voor of tegen te horen -,035 ,779
Hoe vaak praat u over onderwerpen uit het nieuws- om te laten merken wat ik ervan vind ,026 ,661
Hoe vaak praat u over onderwerpen uit het nieuws- om gespreksstof te hebben ,149 ,503
In hoeverre denkt u dat de nieuwsmedia ...- het nieuws op een eerlijke manier brengen? ,878 ,090
In hoeverre denkt u dat de nieuwsmedia ...- het hele verhaal vertellen? ,870 ,068
In hoeverre denkt u dat de nieuwsmedia ...- accuraat zijn? ,846 ,101
In hoeverre denkt u dat de nieuwsmedia ...- te vertrouwen zijn? ,888 ,102
In hoeverre denkt u dat de nieuwsmedia ...- bij conflicten de standpunten van beide partijen verwoorden? ,810 ,072
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a Rotation converged in 3 iterations.

De presentatie volgens MCO/BS. We hebben een principale-componenten-factoranalyse uitgevoerd met 11 variabelen die de houding ten opzichte van het nieuws meten. Zowel het eigenwaarde-criterium (groter dan 1) als het scree plot laten zien dat er twee factoren aanwezig zijn, die samen ongeveer 60 procent van de variantie in de oorspronkelijke variabelen (items) dekken. Na een varimax rotatie, kunnen de factoren benoemd worden als mening over de betrouwbaarheid van het nieuws (variabelen v27 - v31) en motieven om over het nieuws te praten (variabelen v21 - v26). Zie de bovenstaande tabel met de factorladingen.
NB de factorscores zijn toegevoegd als variabelen FAC1_1 (factor 1) en FAC1_5 (factor 2) aan het gegevensbestand. Het is raadzaam om de interpretatie van de factoren toe te voegen als omschrijving (labels) van deze variabelen.
De VARIMAX rotatie levert een makkelijk te interpreteren resultaat op. Een oblique rotatie is dus niet nodig en zal ook geen duidelijk ander resultaat opleveren.

d. Beantwoord de onderzoeksvraag of de houding ten opzichte van het nieuws in dit onderzoek een eendimensionaal concept is.
Nee, de 11 variabelen vormen geen eendimensionale schaal. Op grond van de principale-componenten-factoranalyse concluderen we dat er twee verschillende dimensies zijn: mening over de betrouwbaarheid van het nieuws en motieven om over het nieuws te praten. Wanneer je de namen van de oorspronkelijke variabelen bekijkt, kun je je trouwens afvragen of het wel de bedoeling was dat zij samen één dimensie meten.

II - Constructie van een index voor de hoeveelheid televisie die men kijkt.

e. Beschrijf de variabelen v5uur, v5min, v6uur, v6min: maak univariate grafieken.
Vanwege het ratio meetniveau, zijn histogrammen het meest geschikt. Om extreme waarden te zien, zijn boxplots handig. Maak geen frequentietabellen; die zijn onoverzichtelijk omdat er zoveel verschillende waarden kunnen zijn bij de variabelen.

f. Bewerk de variabelen indien nodig: voeg labels toe aan de variabelen en waarden, definieer onmogelijke of irrelevante waarden als missing values.
De waarden die voorkomen zijn geloofwaardig. Er hoeven geen extra missing values gedefinieerd te worden.

g. Bereken de totale tijd die iemand naar televisie kijkt in een week en voeg dit als nieuwe variabele toe aan het databestand.
NB dit heb je al gedaan in het eerste practicum. Kopieer uit de syntax die je toen hebt gemaakt.

h. Beschrijf en beoordeel de nieuwe variabele.
Het meetniveau is ratio, dus kan een histogram gemaakt worden en zijn het gemiddelde en de standaarddeviatie de relevante centrum- en spreidingsmaat.
Gemiddeld kijken de respondenten iets meer dan 17 uur televisie per week (M = 17,22, SD = 10,49).
Statistics
Aantal uren tv kijken per week
N Valid 1547
Missing 17
Mean 17,2195
Std. Deviation 10,49088

III - Analyse van de samenhang tussen hoeveel televisie men kijkt en de houding ten opzichte van het nieuws.

LET OP: je gebruikt nu als oefening de factorscores van SPSS als schaalvariabele. Later zullen we de schaalvariabele echter steeds apart berekenen als de gemiddelde of totale score op alleen die items die goed genoeg bij de factor passen (zie hint Een schaal construeren).

i. Beschrijf de bivariate samenhang tussen televisiekijktijd en houding ten opzichte van het nieuws met behulp van een of meer bivariate grafieken.
Omdat beide variabelen kwantitatief zijn, kunnen we een spreidingsdiagram maken. Omdat de houding in twee delen uiteenvalt, moeten we twee spreidingsdiagrammen maken. In beide gevallen is er geen duidelijk krom verband tussen kijktijd en de houding ten opzichte van het nieuws.

j. Kies de meest geschikte associatiemaat en bepaal daarmee de sterkte en richting van het verband.
Vanwege het meetniveau ratio, een symmetrisch verband en het feit dat er geen duidelijk krom verband is, mogen we de correlatiecoëfficiënt (R) gebruiken.
Correlations


Mening over de betrouwbaarheid van het nieuws Motieven om over het nieuws te praten Aantal uren tv kijken per week
Mening over de betrouwbaarheid van het nieuws Pearson Correlation 1 ,000 ,103(**)
Sig. (2-tailed)
1,000 ,000
N 1549 1549 1533
Motieven om over het nieuws te praten Pearson Correlation ,000 1 -,014
Sig. (2-tailed) 1,000
,586
N 1549 1549 1533
Aantal uren tv kijken per week Pearson Correlation ,103(**) -,014 1
Sig. (2-tailed) ,000 ,586
N 1533 1533 1547
** Correlation is significant at the 0.01 level (2-tailed).

k. Beantwoord de onderzoeksvraag door de uitkomst te interpreteren zoals je dat geleerd hebt bij BS.
Er is een zwak positief verband tussen kijktijd en de mening over de betrouwbaarheid van het nieuws (R = 0,10). Mensen die meer naar tv kijken hebben een positievere houding over de betrouwbaarheid van het nieuws. Ze vinden het nieuws betrouwbaarder (omdat zij het meer eens zijn met de stellingen dat het nieuws betrouwbaar is).
Er is geen noemenswaardig verband tussen kijktijd en de mening over de motieven om over het nieuws te spreken (R = -0,01). Respondenten die meer tv kijken onderscheiden zich niet in het belang dat zij aan de motieven hechten dan respondenten die minder tv kijken.

IV- Analyse van de samenhang tussen geslacht en de houding ten opzichte van het nieuws via een kruistabel.

l. Beschrijf de variabele geslacht (maak een univariate grafiek of tabel) en bewerk de variabele indien nodig.
Een simpele frequentietabel volstaat om te zien dat het label voor de mannen (v1 = 1) nog ontbreekt maar dat er geen extra missing values gedefinieerd hoeven te worden. Vrijwel de helft van de respondenten is vouw (P = 49,8%).
Bent u een vrouw of man?


Frequency Percent Valid Percent Cumulative Percent
Valid vrouw 778 49,7 49,8 49,8
1 784 50,1 50,2 100,0
Total 1562 99,9 100,0
Missing System 2 ,1

Total 1564 100,0

m. Bewerk de variabele houding ten opzichte van de betrouwbaarheid van het nieuws: groepeer de variabele in vijf klassen met vrijwel gelijke aantallen respondenten.
Hiervoor moeten we eerst weten bij welke waarden de schaalvariabele telkens ongeveer 20% van de waarnemingen bevat. Dit kunnen we in een (lange) frequentietabel bekijken of de grenzen (cutpoints) opvragen voor 5 even groten groepen als statistiek bij de frequentietabel.
Statistics
Mening over de betrouwbaarheid van het nieuws
N Valid 1549
Missing 15
Percentiles 20 -,8540069
40 -,1898691
60 ,3268342
80 ,8759711

We kunnen nu een nieuwe variabele met de 5 klassen krijgen door te hercoderen (RECODE):


Het is verstandig om met een frequentietabel te controleren of de hercodering gelukt is.
Mening over betrouwbaarheid nieuws in 5 klassen


Frequency Percent Valid Percent Cumulative Percent
Valid 1,00 310 19,8 20,0 20,0
2,00 309 19,8 19,9 40,0
3,00 312 19,9 20,1 60,1
4,00 311 19,9 20,1 80,2
5,00 307 19,6 19,8 100,0
Total 1549 99,0 100,0
Missing System 15 1,0

Total 1564 100,0

n. Beschrijf de bivariate verdeling van geslacht en gegroepeerde houding met een kruistabel.
Maak een kruistabel zoals je bij BS hebt geleerd.
Mening over betrouwbaarheid nieuws in 5 klassen * Bent u een vrouw of man? Crosstabulation



Bent u een vrouw of man? Total
vrouw man vrouw
Mening over betrouwbaarheid nieuws in 5 klassen 1,00 Count 137 173 310
% within Bent u een vrouw of man? 17,8% 22,3% 20,0%
2,00 Count 160 149 309
% within Bent u een vrouw of man? 20,8% 19,2% 20,0%
3,00 Count 161 151 312
% within Bent u een vrouw of man? 20,9% 19,4% 20,2%
4,00 Count 154 155 309
% within Bent u een vrouw of man? 20,0% 19,9% 20,0%
5,00 Count 158 149 307
% within Bent u een vrouw of man? 20,5% 19,2% 19,8%
Total Count 770 777 1547
% within Bent u een vrouw of man? 100,0% 100,0% 100,0%

o. Kies de meest geschikte associatiemaat en bepaal daarmee de sterkte en richting van het verband.
Sekse is een nominale variabele en er is een asymmetrisch verband, dus kan Lambda gebruikt worden of Goodman en Kruskal's tau.
Directional Measures



Value Asymp. Std. Error(a) Approx. T(b) Approx. Sig.
Nominal by Nominal Lambda Symmetric ,026 ,019 1,320 ,187
Mening over betrouwbaarheid nieuws in 5 klassen Dependent ,018 ,014 1,223 ,221
Bent u een vrouw of man? Dependent ,039 ,039 ,985 ,325
Goodman and Kruskal tau Mening over betrouwbaarheid nieuws in 5 klassen Dependent ,001 ,001
,274(c)
Bent u een vrouw of man? Dependent ,003 ,003
,275(c)
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.
c Based on chi-square approximation

p. Beantwoord de onderzoeksvraag door de uitkomst te interpreteren zoals je dat geleerd hebt bij BS.
Het verband tussen geslacht en de mening over de betrouwbaarheid van het nieuws is verwaarloosbaar (lambda = 0,02, goodman en kruskal's tau = 0,00). Mannen vinden het nieuws dus niet betrouwbaarder of onbetrouwbaarder dan vrouwen.

Syntax

*Databestand openen.
*Opgave a: beschrijven v21 - v31.
*Frequentieverdelingen met een histogram voor elke variabele.
FREQUENCIES
  VARIABLES=v21 v22 v23 v24 v25 v26 v27 v28 v29 v30 v31
  /HISTOGRAM
  /ORDER= ANALYSIS .

*Opgave b: 78 als missing value bij v24.
*Define Variable Properties.
*v24.
MISSING VALUES v24 ( 78 ).
EXECUTE.

*Opgave c en d: principale-componenten-factoranalyse.
* Standaard met eigenwaarde-criterium en varimax rotatie.
FACTOR
  /VARIABLES v21 v22 v23 v24 v25 v26 v27 v28 v29 v30 v31 /MISSING LISTWISE
 /ANALYSIS v21 v22 v23 v24 v25 v26 v27 v28 v29 v30 v31
  /PRINT INITIAL EXTRACTION ROTATION
  /PLOT EIGEN
  /CRITERIA MINEIGEN(1) ITERATE(25)
  /EXTRACTION PC
  /CRITERIA ITERATE(25)
  /ROTATION VARIMAX
  /SAVE REG(ALL)
  /METHOD=CORRELATION .
*Naam van variabelen met factorscores aanpassen aan de interpretatie.
*Define Variable Properties.
*FAC1_1.
VARIABLE LABELS FAC1_1 'Mening over de betrouwbaarheid van het nieuws'.
*FAC1_5.
VARIABLE LABELS FAC1_5 'Motieven om over het nieuws te praten'.
EXECUTE.

*Opgave e: beschrijving van de tijd die men naar televisie kijkt.
FREQUENCIES
  VARIABLES=v5uur v5min v6uur v6min /FORMAT=NOTABLE
  /HISTOGRAM
  /ORDER= ANALYSIS .

*Opgave f: univariate bewerking.
*De waarden die voorkomen zijn geloofwaardig. Er hoeven geen extra missing values gedefinieerd te worden.

*Opgave g: indexvariabele laten berekenen.
*NB je kunt de nieuwe variabelen natuurlijk ook een andere naam geven.
COMPUTE TVpweek = ((v5uur + v5min / 60) * 5) + ((v6uur + v6min / 60) * 2) .
VARIABLE LABELS TVpweek 'Aantal uren tv kijken per week' .
EXECUTE .

*Opgave h: Beschrijf en beoordeel de nieuwe variabele.
*Een histogram met de relevante centrum en spreidingsmaat.
FREQUENCIES
  VARIABLES=TVpweek /FORMAT=NOTABLE
  /STATISTICS=STDDEV MEAN
  /HISTOGRAM
  /ORDER= ANALYSIS .

*Opgave i: bivariate samenhang tussen televisiekijktijd en houding ten opzichte van het nieuws.
GRAPH
  /SCATTERPLOT(BIVAR)=TVpweek WITH FAC1_1
  /MISSING=LISTWISE .
GRAPH
  /SCATTERPLOT(BIVAR)=TVpweek WITH FAC1_5
  /MISSING=LISTWISE .

*Opgave j en k: associatie.
CORRELATIONS
  /VARIABLES=FAC1_1 FAC1_5 TVpweek
  /PRINT=TWOTAIL NOSIG
  /MISSING=PAIRWISE .

*Opgave l: beschrijving en eventuele bewerking van de variabele geslacht.
FREQUENCIES
  VARIABLES=v1
  /ORDER= ANALYSIS .
*Toevoegen value label voor mannen.
*Define Variable Properties.
*v1.
VALUE LABELS v1
     0 'vrouw'
     1 'man' .
EXECUTE.

*Opgave m: Bewerk de variabele houding.
FREQUENCIES
  VARIABLES=FAC1_1
  /NTILES= 5
  /ORDER= ANALYSIS .
*Hercoderen.
RECODE
  FAC1_1
  (Lowest thru -0.85=1) (-0.85 thru -0.19=2) (-0.19 thru 0.33=3) (0.33
  thru 0.88=4) (0.88 thru Highest=5) INTO FAC1_1HER .
VARIABLE LABELS FAC1_1HER 'Mening over betrouwbaarheid nieuws in 5 klassen'.
EXECUTE .
*Controle op hercodering.
FREQUENCIES
  VARIABLES=FAC1_1HER
  /ORDER= ANALYSIS .

*Opgave n: Beschrijf de bivariate verdeling.
CROSSTABS
  /TABLES=FAC1_1HER BY v1
  /FORMAT= AVALUE TABLES
  /STATISTIC=LAMBDA
  /CELLS= COUNT COLUMN
  /COUNT ROUND CELL .