Technieken voor het multivariaat bewerken van twee of meer variabelen

Inhoud:
Een schaal construeren in SPSS
Een index construeren

Een schaal construeren in SPSS

We gebruiken alleen Principale Componenten Analyse (PCA) als techniek om schalen te construeren.

SPSS output

De belangrijke onderdelen van de output zijn:

  1. De tabel met communaliteiten geeft voor elk item het percentage verklaarde variantie door alle geselecteerde componenten samen. Deze getallen staan in de kolom Extraction. Ze laten zien welk deel van de verschillen (variantie) in de antwoorden op de oorspronkelijke vragen gedekt ('verklaard') worden door de geselecteerde componenten.
    Communalities

    Initial Extraction
    Ik game omdat ? beter worden 1,000 ,900
    Ik game omdat ? score verbeteren 1,000 ,972
    Ik game omdat ?communiceren 1,000 ,792
    Als ik game dan ? band voelen 1,000 ,902
    Extraction Method: Principal Component Analysis.

  2. De tabel met de eigenwaarden en percentages verklaarde variantie voor elke component (inclusief de niet-geselecteerde componenten). De eigenwaarden worden over de niet-geroteerde oplossing berekend . Onder Initial Eigenvalues staan de eigenwaarden van de componenten onder Total. Het meest gebruikte criterium om componenten te selecteren, is dat ze een eigenwaarde hebben die groter is dan 1.
    De verklaarde varianties per component worden zowel voor de ongeroteerde oplossing gegeven (onder Extraction Sums of Squared Loadings) als voor de geroteerde oplossing gegeven (onder Rotation Sums of Squared Loadings). Hier zie je hoe goed de geselecteerde componenten de oorspronkelijke gegevens samenvatten. Dit kun je ook als criterium gebruiken om componenten te selecteren: verklaren de geselecteerde componenten minstens 70% van de totale variantie? Draagt een component substantieel bij aan het percentage verklaarde variantie?
    Total Variance Explained
    Component Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
    Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
    1 1,964 49,107 49,107 1,964 49,107 49,107 1,743 43,568 43,568
    2 1,081 27,015 76,122 1,081 27,015 76,122 1,302 32,554 76,122
    3 ,510 12,742 88,864






    4 ,445 11,136
    100,000





    Extraction Method: Principal Component Analysis.

  3. Het scree plot is een visuele weergave van de eigenwaarden van alle componenten. Hierin zie je hoeveel componenten relatief hoge eigenwaarden hebben: de componenten 'boven' de knik in de grafiek. Dit is een tweede criterium om het aantal componenten te kiezen. In onderstaande grafiek is die knik (bij de 3e component) overigens niet erg duidelijk.


  4. De tabel met de component matrix toont  de componentlading (of correlatie)  van elk item met elke geselecteerde component na rotatie.  Wanneer er maar één component geselecteerd wordt kan er niet geroteerd worden en gebruik je de (niet-geroteerde) 'Component Matrix'.
    Rotated Component Matrix(a)

    Component
    1 2
    Ik game omdat ? beter worden ,771 ,356
    Ik game omdat ? score verbeteren ,546 ,709
    Ik game omdat ?communiceren ,780 -,378
    Als ik game dan ? band voelen ,679 -,548
    Extraction Method: Principal Component Analysis.
    Rotation Method: Varimax with Kaiser Normalization.
    a Rotation converged in 3 iterations.

Rapportage

Zorg ervoor dat je de volgende onderdelen in je interpretatie hebt staan:

Een index construeren

Met een index vervang je een aantal variabelen door een nieuwe variabele. Daarmee wordt echter geen abstract, niet direct meetbaar concept gemeten, maar iets wat in principe concreet is en direct gemeten zou kunnen worden. Bijvoorbeeld de totale tijd dat iemand naar de publieke omroepen kijkt, kan eenvoudig berekend worden als de som van de kijktijd naar Nederland 1, Nederland 2, Nederland 3, etcetera.

Een index is meestal gewoon een gemiddelde of totaalscore van een respondent op een aantal variabelen. Je kunt een index daarom met het commando COMPUTE creëren.

Let op: bij het COMPUTE commando kun je ook een groot aantal voorgedefinieerde commando's gebruiken, bijvoorbeeld SUM() en MEAN() die respectievelijk de somscore en de gemiddelde score berekenen over de variabelen die je tussen de haakjes zet.
Deze commando's hebben de eigenaardigheid dat wanneer iemand een missing value heeft op een van de variabelen, die variabele buiten beschouwing wordt gelaten. De som en het gemiddelde wordt dan over de resterende variabelen berekend. Dit kan vooral bij de somscore rare resultaten opleveren.
Wanneer je iemand geen indexscore wilt geven wanneer die op een of meer van de oorspronkelijke variabelen een misisng value heeft, moet je zelf een formule voor de optelling (en deling) maken.

Rapportage

Je hoeft in de tekst alleen maar aan te geven welke formule je hebt gebruikt om de index samen te stellen: een somscore, een gemiddelde, of iets anders. Meestal kun je dit duidelijk maken in de naam die je aan de index geeft.