Een centrum-, spreiding- of associatiemaat kiezen

Bij Beschrijvende Statistiek (BS) heb je geleerd welke centrum-, spreiding- of associatiemaat je in welke situatie moet gebruiken. Het meetniveau van de variabele(n) is daarbij het belangrijkste argument. De keuzeschema's staan hieronder.
Raadpleeg het digitale werkboek van BS voor nadere informatie. Hiervoor heb je een UvAnetID nodig.

Keuzeschema centrummaten en spreidingsmaten
centrummaat modus mediaan rekenkundig gemiddelde
spreidingsmaat kwartielafstand standaarddeviatie, variantie
1. Kies 1.1 inhoudelijk wat komt het vaakst voor? wat is de middelste waarde? wat is het balanspunt van de verdeling
1.2 minimaal meetniveau nominaal ordinaal interval
1.3 vormverdeling bij elke vorm van de verdeling bruikbaar bij elke vorm van de verdeling bruikbaar niet optimaal bij zeer scheve verdeling
2. Calculeer Analyze-> Descriptive Statistics -> Frequencies -> Statistics Analyze-> Descriptive Statistics -> Frequencies -> Statistics Analyze-> Descriptive Statistics -> Frequencies -> Statistics
3. Controleer onbruikbaar bij een verdeling met veel toppen, bijvoorbeeld bij ongegroepeerde interval variabele   hoe groter het verschil tussen Modus, Mediaan en rekenkundig gemiddelde, des te schever de verdeling
4. Concludeer algemeen
1. motiveer de keuze van de centrum- en spreidingsmaat (zie Kies en Controleer) 
2. gebruik de waarde van de spreidingsmaat om iets te zeggen over de nauwkeurigheid van de berekende centrummaat: hoe kleiner de spreiding, des te beter karakteriseert het centrum de verdeling
Modus: "de meest voorkomende waarde op de variabele X is A". Mediaan: "de middelste waarde op de variabele X is A" of " de helft van de onderzoekseenheden heeft A of minder op variabele X en de helft van de onderzoekseenheden heeft A of meer op variabele X".
Interkwartielafstand: "de gemiddelde afwijking op variabele X ten opzichte van de mediaan is A" of "de middelste helft van de waarnemingen ligt tussen (1e kwartielgrens) en (3e kwartielgrens).
Rekenkundige gemiddelde: "de (eenheden) hebben gemiddeld A op de variabele X".
Standaarddeviatie en variantie: "de gemiddelde afwijking ten opzichte van het rekenkundig gemiddelde".

Keuzeschema associatiematen

    Percentages Cramers V Phi Goodman & Kruskals tau Lambda Gamma Kendalls tau-b Spearman's rangcorrelatiecoëfficiënt rho Somers' d Productmoment correlatiecoëfficiënt r Regressieanalyse Eta
1. Kies 1.1 inhoudelijk inhoud van een verband bepalen om statistische onafhankelijkheid aan te tonen om statistische onafhankelijkheid aan te tonen in een 2x2 kruistabel om de afhankelijke variabele te voorspellen om de afhankelijke variabele te voorspellen (op grond van de modus) om een monotoon verband aan te tonen op grond van concordante en discordante paren om een monotoon verband aan te tonen waarbij rekening wordt gehouden met geknoopte paren om een monotoon verband aan te tonen op grond van de rangorde van scores om een monotoon verband tussen een afhankelijke en een onafhankelijke variabele vast te stellen om een lineair verband aan te tonen om een variabele te voorspellen (schatten) op grond van een lineair model om vast te stellen in hoeverre groepen verschillend scoren
  1.2 minimaal meetniveau nominaal nominaal nominaal nominaal nominaal beide variabelen minstens ordinaal beide variabelen minstens ordinaal beide variabelen minstens ordinaal beide variabelen minstens ordinaal beide variabelen minstens interval beide variabelen minstens interval een variabele  is  nominaal, dan andere minstens interval
  1.3 symmetrie symmetrisch en asymmetrisch symmetrisch symmetrisch asymmetrisch asymmetrisch symmetrisch symmetrisch symmetrisch asymmetrisch symmetrisch asymmetrisch asymmetrisch
  1.4 overige eisen in kruistabel de onafhankelijke variabele in de kolommen plaatsen en kolompercentages kiezen   alleen voor 2x2 kruistabel kies op inhoudelijke gronden de afhankelijke variabele kies op inhoudelijke gronden de afhankelijke variabele de eenheden liggen niet voor het grootste deel binnen één rij of kolom van de kruistabel kan alleen in vierkante kruistabellen +1 of -1 worden variabele is ongegroepeerd kies op inhoudelijke gronden de afhankelijke variabele; Somer's d kan alleen in vierkante kruistabellen +1 of -1 worden   kies op inhoudelijke gronden de afhankelijke variabele  
2. Calculeer Analyze ->
Descriptive Statistics -> Crosstabs
Analyze ->
Descriptive Statistics -> Crosstabs -> Statistics
Analyze ->
Descriptive Statistics -> Crosstabs -> Statistics
Analyze ->
Descriptive Statistics -> Crosstabs -> Statistics
NB wordt automatisch berekend wanneer je lambda kiest
Analyze ->
Descriptive Statistics -> Crosstabs -> Statistics
Analyze ->
Descriptive Statistics -> Crosstabs -> Statistics
Analyze ->
Descriptive Statistics -> Crosstabs -> Statistics
Analyze -> Correlate ->
Bivariate -> Spearman
Analyze ->
Descriptive Statistics -> Crosstabs -> Statistics
Analyze -> Correlate ->
Bivariate -> Pearson
Analyze -> Regression -> Linear Analyze ->
Descriptive Statistics -> Crosstabs -> Statistics
NB ook de nominale variabele moet met cijfers gecodeerd zijn
3. Controleer n.v.t. hebben alle cellen in een kruistabel met beide variabelen minstens één als verwachte waarde en is maximaal 20% van de verwachte waarden kleiner dan 5? hebben alle cellen in een kruistabel met beide variabelen minstens één als verwachte waarde en is maximaal 20% van de verwachte waarden kleiner dan 5? n.v.t. n.v.t. is het verband monotoon (alleen stijgend of alleen dalend)? (zie spreidingsdiagram) is het verband monotoon (alleen stijgend of alleen dalend)? (zie spreidingsdiagram) is het verband monotoon, d.w.z. niet duidelijk stijgend én dalend? (zie spreidingsdiagram) is het verband monotoon, d.w.z. niet duidelijk stijgend én dalend? (zie spreidingsdiagram) geen extreme waarden (zie boxplot)
het verband is lineair d.w.z. niet duidelijk krom? (zie spreidingsdiagram)
geen extreme waarden (zie boxplot)
het verband is lineair d.w.z. niet duidelijk krom? (zie spreidingsdiagram)
(nog toevoegen)
4. Concludeer ga na of er celpercentages (in de vergelijkingsrichting) duidelijk van elkaar afwijken, zo ja, geef dan in woorden aan welke combinaties van waarden relatief vaak of relatief weinig voorkomen ("als... dan..."-uitspraak) beoordeel de sterkte van het verband en interpreteer de inhoud van het verband (zie percentages), tenzij er geen verband is ("als... dan..."-uitspraak) beoordeel de sterkte van het verband en interpreteer de inhoud van het verband (zie percentages), tenzij er geen verband is ("als... dan..."-uitspraak) beoordeel de sterkte van het verband en geef het percentage van de voorspellingsverbetering ("Er is een voorspellingsverbetering van ...% voor ... wanneer we rekening houden met ..." of ("We kunnen ... voor ..% beter voorspellen wanneer we rekening houden met ...") beoordeel de sterkte van het verband en geef het percentage van de voorspellingsverbetering ("Er is een voorspellingsverbetering van ...% voor ... wanneer we rekening houden met ..." of ("We kunnen ... voor ..% beter voorspellen wanneer we rekening houden met ...") beoordeel de sterkte en richting van het verband;
de richting kan weergegeven worden in een "naarmate ... des te..."-uitspraak;
bij Gamma mag je wat strenger zijn in de beoordeling van de tserkte van het verband
beoordeel de sterkte en richting van het verband;
de richting kan weergegeven worden in een "naarmate ... des te..."-uitspraak
beoordeel de sterkte en richting van het verband ; de richting kan weergegeven worden in een "naarmate ... des te..."-uitspraak beoordeel de sterkte en richting van het verband ; de richting kan weergegeven worden in een "naarmate ... des te..."-uitspraak waarbij de afhankelijke variabele acter "des te" genoemd moet worden beoordeel de sterkte en richting van het verband
de richting kan weergegeven worden in een "naarmate ... des te..."-uitspraak
beoordeel hoe goed het model past met de determinatie-
coëfficiënt (R2 "de proportie verklaarde variantie van ... is ...%") en de gestandaardiseerde regressiecoëfficiënten betekenen ("het partiële effect van ... op ... is ..." of "... heeft het sterkste partiële effect op ..."); leg uit wat de intercept/constante betekent ("de voorspelde waarde van ... wanneer ... nul is") en wat de ongestandaardiseerde regressiecoëfficiënten ("de voorspelde toename van ... wanneer ... één groter wordt terwijl ... niet veranderen") betekenen.
beoordeel de sterkte van het verband en bespreek de gemiddelde scores van de groepen; de sterkte van het verband kan op grond van de waarde van eta ingedeeld worden in geen, zwak, matig enzovoort; een alternatief is om het kwadraat van eta te interpreteren als de proportie verklaarde variantie in de afhankelijke variabele
  Vuistregel sterkte verband: 0 - .10 zeer zwak/geen verband; .11 - .30 zwak verband; .31 - .50 redelijk verband; .51 - .80 sterk verband; .81 - .99 zeer sterk verband; 1 perfect verband. Vuistregel voor de sterkte van het verband net als bij associatiematen voor nominaal meetniveau. Maar nu kunnen ook negatieve waarden (tussen 0 en -1) voorkomen.   Vuistregel: als bij associatiematen voor nominaal meetniveau.