Hints bij de opgave

Technieken voor het multivariaat bewerken van twee of meer variabelen

Inhoud:
Een schaal construeren in SPSS
Een index construeren

Een schaal construeren in SPSS

We gebruiken alleen Principale Componenten Analyse (PCA) als techniek om schalen te construeren.

Kies uit het menu: ANALYZE - DIMENSION REDUCTION - FACTOR.
In het betreffende scherm dien je twee of meer variabelen te selecteren waarmee je een factoranalyse wilt uitvoeren. Selecteer de betreffende variabelen door op de pijl te klikken naar het schermpje transporteren waarboven staat variables. Om de schaalanalyse te laten uitvoeren dien je op OK te klikken.
Klik op de knop DESCRIPTIVES: Geeft je de mogelijkheid beschrijvende statistieken op te vragen over de items. Dit is niet nodig wanneer je vooraf de variabelen hebt beschreven en bewerkt.
Klik op de knop EXTRACTION. Hiermee definieer je uit hoeveel factoren (dimensies) de oplossing dient te bestaan. De standaard instelling is: alle factoren waarvan de eigenwaarde hoger is dan 1. In het begin is het beter deze instellingen niet te veranderen.
Vraag in dit dialoogscherm altijd het scree plot op.
Klik op de knop ROTATION. De resultaten van factor-analyse met varimax rotatie zijn vaak beter interpreteerbaar dan de oorspronkelijke (ongeroteerde) oplossing. Deze kun je hier selecteren.
Het boek behandelt ook oblique rotatie, maar die zullen we niet toepassen.
Klik op de knop SCORES. Als je helemaal tevreden bent met de door factor-analyse gegeven oplossing, kun je de scores van respondenten op elk van de dimensies laten bewaren in de vorm van nieuwe variabelen. Hier kun je dat opgeven. Bij IS gebruiken we deze schaalvariabelen normaliter niet omdat we eerst de betrouwbaarheid van de schaal willen bepalen.
Geef deze variabele naderhand (na de factoranalyse) labels die duidelijk maken wat jouw interpretatie is.
Klik op de knop OPTIONS: Biedt keuzes mbt het behandelen van missende waarden en de presentatie van de uitkomsten. Het is voor de interpretatie erg handig om hier onder Coefficient Display Format het vakje Sorted by size aan te vinken.
Klik op PASTE en laat de syntax daarna uitvoeren (RUN).

SPSS output

De belangrijke onderdelen van de output zijn:

De tabel met communaliteiten geeft voor elk item het percentage verklaarde variantie door alle geselecteerde componenten samen. Deze getallen staan in de kolom Extraction. Ze laten zien welk deel van de verschillen (variantie) in de antwoorden op de oorspronkelijke vragen gedekt ('verklaard') worden door de geselecteerde componenten.

**Communalities**
	Initial	Extraction
Ik game omdat ? beter worden	1,000	,900
Ik game omdat ? score verbeteren	1,000	,972
Ik game omdat ?communiceren	1,000	,792
Als ik game dan ? band voelen	1,000	,902
Extraction Method: Principal Component Analysis.

De tabel met de eigenwaarden en percentages verklaarde variantie voor elke component (inclusief de niet-geselecteerde componenten). De eigenwaarden worden over de niet-geroteerde oplossing berekend . Onder Initial Eigenvalues staan de eigenwaarden van de componenten onder Total. Het meest gebruikte criterium om componenten te selecteren, is dat ze een eigenwaarde hebben die groter is dan 1.
De verklaarde varianties per component worden zowel voor de ongeroteerde oplossing gegeven (onder Extraction Sums of Squared Loadings) als voor de geroteerde oplossing gegeven (onder Rotation Sums of Squared Loadings). Hier zie je hoe goed de geselecteerde componenten de oorspronkelijke gegevens samenvatten. Dit kun je ook als criterium gebruiken om componenten te selecteren: verklaren de geselecteerde componenten minstens 70% van de totale variantie? Draagt een component substantieel bij aan het percentage verklaarde variantie?

**Total Variance Explained**
Component	Initial Eigenvalues			Extraction Sums of Squared Loadings			Rotation Sums of Squared Loadings
Component	Total	% of Variance	Cumulative %	Total	% of Variance	Cumulative %	Total	% of Variance	Cumulative %
1	1,964	49,107	49,107	1,964	49,107	49,107	1,743	43,568	43,568
2	1,081	27,015	76,122	1,081	27,015	76,122	1,302	32,554	76,122
3	,510	12,742	88,864
4	,445	11,136	100,000
Extraction Method: Principal Component Analysis.

Het scree plot is een visuele weergave van de eigenwaarden van alle componenten. Hierin zie je hoeveel componenten relatief hoge eigenwaarden hebben: de componenten 'boven' de knik in de grafiek. Dit is een tweede criterium om het aantal componenten te kiezen. In onderstaande grafiek is die knik (bij de 3e component) overigens niet erg duidelijk.

De tabel met de component matrix toont de componentlading (of correlatie) van elk item met elke geselecteerde component na rotatie. Wanneer er maar één component geselecteerd wordt kan er niet geroteerd worden en gebruik je de (niet-geroteerde) 'Component Matrix'.

**Rotated Component Matrix(a)**
	Component
	1	2
Ik game omdat ? beter worden	,771	,356
Ik game omdat ? score verbeteren	,546	,709
Ik game omdat ?communiceren	,780	-,378
Als ik game dan ? band voelen	,679	-,548
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.
a Rotation converged in 3 iterations.

Rapportage

Zorg ervoor dat je de volgende onderdelen in je interpretatie hebt staan:

Het soort factoranalyse: bij IS is dit altijd principale-componenten-factoranalyse.
De oorspronkelijke variabelen die gebruikt zijn.
Het aantal factoren (componenten) met het selectiecriterium dat gebruikt is en het totale percentage verklaarde variantie.
Lees de eigenwaarde af aan de tabel "Total Variance Explained" in de kolom "Total" onder "Initial Eigenvalues". De eigenwaarden horen bij de ongeroteerde oplossing. Die gebruik je dus voor de selectie van het aantal factoren.
In het scree plot zie je hoeveel componenten boven (links) van de knik liggen.
Het percentage verklaarde variantie van elke component lees je af aan de tabel "Total Variance Explained": die zijn verschillend voor de ongeroteerde en geroteerde oplossing. Je gebruikt die voor de geroteerde oplossing (als die er is) omdat dit de oplossing is die je inhoudelijk interpreteert (zie hieronder).
Het soort rotatie: bij IS is dit altijd orthogonale (Varimax) rotatie.
De tabel met componentladingen.
Dit is de tabel "Component Matrix", bij voorkeur de tabel "Rotated Component Matrix".
De benoeming van de factoren: jouw interpretatie van de dimensies of constructen die de factoren vertegenwoordigen.
De componentladingen geven de correlatie tussen de items en de component (factor of dimensie). Kijk naar de items die hoog (positief of negatief) laden op een factor (bijvoorbeeld minstens 0,45) en probeer onder woorden te brengen wat deze items gemeenschappelijk hebben.
Let op: wanneer items positief laden betekent dat dat respondenten met een hogere score op deze items ook een hogere score hebben op de schaal (component). Negatieve componentladingen geven het omgekeerde aan: hogere scores op de items geven een lagere schaalscore.
Je moet ook kijken naar de betekenis van de waarden op de oorspronkelijke items. Wanneer de items omgekeerd gecodeerd zijn, namelijk dat een lagere score aangeeft dat men iets belangrijker vindt of er meer mee eens is, dan betekent een hoge score op een component waar deze items positieve ladingen op hebben, dat respondenten met een hoge schaalscore juist het achterliggende abstracte concept onbelangrijker vinden of het er meer mee oneens zijn. Je moet de component dan liever benoemen als "hoe onbelangrijk mensen iets vinden" of "gebrek aan belangstelling voor" dan "hoe belangrijk mensen iets vinden" of "belangstelling voor".

Een index construeren

Met een index vervang je een aantal variabelen door een nieuwe variabele. Daarmee wordt echter geen abstract, niet direct meetbaar concept gemeten, maar iets wat in principe concreet is en direct gemeten zou kunnen worden. Bijvoorbeeld de totale tijd dat iemand naar de publieke omroepen kijkt, kan eenvoudig berekend worden als de som van de kijktijd naar Nederland 1, Nederland 2, Nederland 3, etcetera.

Een index is meestal gewoon een gemiddelde of totaalscore van een respondent op een aantal variabelen. Je kunt een index daarom met het commando COMPUTE creëren.

Kies binnen het menu TRANSFORM de optie COMPUTE VARIABLE.
Er wordt een scherm geopend: "Compute variable". In het veld "Target variable" voer je de naam in van de nieuwe variabele die je gaat aanmaken, bijvoorbeeld "NLINDEX": het aantal uren dat iemand naar de 3 grootste publieke zenders kijkt per dag. Door op de knop "Type & label" te klikken kun je labels toekennen.
Nu wil je de formule definiëren om de waarden van NLINDEX te berekenen. Stel dat we drie variabelen hebben die ieder het aantal minuten geven dat iemand gemiddeld op een dag kijkt naar Nederland 1 (totzend1), Nederland 2 (totzend2) en Nederland 3 (totzend3). We gaan nu eerst het aantal minuten optellen dat iedere respondent naar NL1, NL2 en NL3 kijkt en dit totaal delen door 60. Dit bereiken we door de som tussen haakjes te zetten. De formule die in het veld "numeric expression" komt te staan luidt nu: "(totzend1 + totzend2 + totzend3) / 60".
Je kunt dit doen door te typen of door de variabelen en symbolen te selecteren met de muis.
Als je klaar bent druk je op PASTE en in het syntaxscherm laat je het commando vervolgens uitvoeren..

Let op: bij het COMPUTE commando kun je ook een groot aantal voorgedefinieerde commando's gebruiken, bijvoorbeeld SUM() en MEAN() die respectievelijk de somscore en de gemiddelde score berekenen over de variabelen die je tussen de haakjes zet.
Deze commando's hebben de eigenaardigheid dat wanneer iemand een missing value heeft op een van de variabelen, die variabele buiten beschouwing wordt gelaten. De som en het gemiddelde wordt dan over de resterende variabelen berekend. Dit kan vooral bij de somscore rare resultaten opleveren.
Wanneer je iemand geen indexscore wilt geven wanneer die op een of meer van de oorspronkelijke variabelen een misisng value heeft, moet je zelf een formule voor de optelling (en deling) maken.

Rapportage

Je hoeft in de tekst alleen maar aan te geven welke formule je hebt gebruikt om de index samen te stellen: een somscore, een gemiddelde, of iets anders. Meestal kun je dit duidelijk maken in de naam die je aan de index geeft.