Antwoord bij Oefening 4.4

a. Toets het vermoeden van de onderzoeker met behulp van de (Pearson) correlatiecoefficient.

Beschrijf beide variabelen eerst voordat je de correlatietoets uitvoert. Omdat het geen categorische variabelen zijn, is het handig om enkele beschrijvende statistieken en histogrammen op te vragen. Ook een spreidingsdiagram is belangrijk omdat de correlatiecoefficient een lineair (rechtlijnig) verband veronderstelt.
Er is een onmogelijke waarde: een respondent (nummer 87) heeft een schaalscore 0 voor ouderlijke aandacht terwijl deze scores tussen 1 en 9 moeten zitten. Deze waarde moet als missing worden aangemerkt. Het chatten blijkt verder enorm scheef verdeeld (skewness = 5,66).
Het histogram toont een duidelijk niet lineair verband: als de ouderlijke aandacht lager wordt, gaat het aantal chat uren steeds sneller omhoog. Het is daarom maar de vraag of de correlatiecoefficient een geschikte associatiemaat is voor het verband tussen beide variabelen.

Statistics
  Schaalscore aandacht ouders Aantal uren chatten in de afgelopen 7 dagen
N Valid 92 93
Missing 1 0
Mean 6,3776 4,26
Std. Deviation 1,91145 8,043
Skewness -,976 5,657
Std. Error of Skewness ,251 ,250
Minimum 1,02 0
Maximum 9,00 65

Op grond van het vermoeden van de onderzoeker kun je overwegen om een linkseenzijdige toets te doen waarbij je ervan uitgaat dat de correlatie alleen negatief kan zijn (H0: ρ ≥ 0; H1: ρ < 0). Je moet dan in SPSS de eenzijdige significantie opvragen.
Voor het resultaat maakt het overigens niet uit of je een eenzijdige of tweezijdige toets uitvoert: in beide gevallen is de uitkomst significant met p < 0,001. De correlatiecoefficient is -0,52 in de steekproef, dus negatief zoals verwacht.
De verwachting van de onderzoeker lijkt dus uit te komen: hoe minder ouderlijke aandacht, des te meer chat de tiener.

b. Toets het vermoeden van de onderzoeker met behulp van Spearman's rangcorrelatie.

De controles hebben we al uitgevoerd, dus we kunnen Spearman's rangcorrelatie direct laten uitrekenen en toetsen.
De rangcorrelatiecoefficient is -0,15, dus aanmerkelijk lager (dichter bij nul) dan de correlatiecoefficient die we bij a hebben uitgerekend. De rangcorrelatie is niet significant: p = 0,078 eenzijdig, p = 0,156 tweezijdig.
De verwachting van de onderzoeker lijkt nu niet uit te komen: er is hoogstwaarschijnlijk geen relatie tussen ouderlijke aandacht en de tijd dat een tiener chat in de populatie waar de steekproef uit getrokken is.

c. Maak een beredeneerde keuze uit de twee resultaten.

Bij een duidelijk krom verband kunnen we de (productmoment) correlatiecoefficient (van Pearson) beter niet gebruiken omdat die uitgaat van een rechtlijnig verband. In de steekproef zitten maar een paar tieners die heel veel chatten (je kunt de cirkeltjes tellen aan de linker kant van het spreidingsdiagram), maar zij zorgen ervoor dat er een vrij steile rechte lijn door de puntenwolk getrokken wordt.
Verder kun je deze maat beter niet gebruiken wanneer de verdelingen duidelijk niet normaal zijn. Dat lijkt hier zeker te gelden voor de variabele 'het aantal uren dat de tiener chat'.
De rangcorrelatiecoefficient wordt niet beïnvloed door een paar extreem hoge of lage scores. Het merendeel van de tieners heeft aandachtsscores tussen de 5 en 9, dus de verschillen tussen hun wat betreft het chatten wegen zwaarder door. Binnen die groep hangen de verschillen niet samen met de hoeveelheid aandacht, vandaar dat de rangcorrelatiecoefficient niet significant is.
Al met al is het beter om hier de rangcorrelatiecoefficient te gebruiken omdat de paar extreem hoge scores op de chat-variabele anders de resultaten teveel beïnvloeden. Bij een andere steekproef hadden er makkelijk minder van dit soort extreme gevallen kunnen voorkomen.
Vermoedelijk zou een grotere steekproef wel een significant resultaat opleveren, maar daar schieten we nu niets mee op.

Wanneer je overigens de vier extreme waarden op de chat-variabele vanaf het begin had weggelaten, was de (Pearson) correlatiecoefficient veel lager geweest (-0,23) maar nog steeds significant (p = 0,017).

Syntax

*Syntax bij Oefening 4.4

*Opdracht a.
*Beschrijven en bewerken van de variabelen.
FREQUENCIES VARIABLES=aandacht chatten
  /FORMAT=NOTABLE
  /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN SKEWNESS SESKEW
  /HISTOGRAM NORMAL
  /ORDER=ANALYSIS.
*Misisng value voor aandacht score 0.
* Define Variable Properties.
*aandacht.
MISSING VALUES aandacht(0,00).
EXECUTE.
*Opnieuw beschrijving.
FREQUENCIES VARIABLES=aandacht chatten
  /FORMAT=NOTABLE
  /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN SKEWNESS SESKEW
  /HISTOGRAM NORMAL
  /ORDER=ANALYSIS.
*Spreidingsdiagram.
GRAPH
  /SCATTERPLOT(BIVAR)=aandacht WITH chatten
  /MISSING=LISTWISE.
*Correlatiecoefficient (eenzijdig en tweezijdig).
CORRELATIONS
  /VARIABLES=aandacht chatten
  /PRINT=ONETAIL NOSIG
  /MISSING=PAIRWISE.
CORRELATIONS
  /VARIABLES=aandacht chatten
  /PRINT=TWOTAIL NOSIG
  /MISSING=PAIRWISE.

*Opdracht b.
*Spearman's rangcorrelatie.
NONPAR CORR
  /VARIABLES=aandacht chatten
  /PRINT=SPEARMAN ONETAIL NOSIG
  /MISSING=PAIRWISE.
NONPAR CORR
  /VARIABLES=aandacht chatten
  /PRINT=SPEARMAN TWOTAIL NOSIG
  /MISSING=PAIRWISE.