Analyseproces

Het statistische analyseproces begint wanneer de gegevens verzameld zijn en ingevoerd zijn in SPSS. Het eindigt wanneer de analyses zijn uitgevoerd en de resultaten zijn geïnterpreteerd waarmee de onderzoeksvragen beantwoord worden.

Dit proces bevat een viertal stappen: beschrijven, bewerken, beoordelen en beantwoorden van de onderzoeksvraag. De eerste drie stappen zijn eigenlijk voorbereidingen die nodig zijn om het uiteindelijke doel te bereiken, namelijk het antwoord op de onderzoeksvragen.

  1. Beschrijven.
    Het beschrijven van de verzamelde gegevens heeft tot doel een indruk te krijgen van deze gegevens. Een beschrijving van de gegevens, vooral met tabellen of grafieken maar ook met centrum- en spreidingsmaten, geeft een indruk waar de onderzochte personen of dingen hoog scoren, waar laag; waar ze veel van elkaar verschillen, waar weinig; of ze gelijkelijk verdeeld zijn over verschillende categorieën of niet.
    Met deze beschrijving kun je nagaan of de analyses die je van plan was, ook uitgevoerd kunnen worden. Als je bijvoorbeeld mannen met vrouwen wilde vergelijken, zijn er dan genoeg van beide in de dataset? Zijn er (vrijwel) geen mannen of vrouwen, dan kun je de vergelijking niet maken.
    De beschrijving laat je ook zien hoe je variabelen het beste kunt groeperen in klassen. Stel dat je drie leeftijdgroepen wilt vergelijken en je hebt precieze leeftijden gevraagd in je enquête. Met een frequentietabel van de leeftijden kun je dan zien waar de grenzen liggen tussen de 33% jongste personen, de 33% middelste en de 33% oudste personen.
    Tenslotte is de beschrijving belangrijk omdat je waarden in je data kunt tegenkomen die eigenlijk niet mogen voorkomen. Dit kunnen codeerfouten zijn, bijvoorbeeld een geslacht mon of respondenten die niet tot je populatie behoren, bijvoorbeeld 13-jarigen in een onderzoek onder volwassenen. Dergelijke fouten moeten rechtgezet worden voordat je verder gaat met de analyses.
  2. Bewerken.
    Na het invoeren van de gegevens zijn er vaak foutjes in de gegevens die gecorrigeerd moeten worden, bijvoorbeeld door ze als missing values aan te merken of ze te hercoderen. Ook kan het voorkomen dat sommige waarden (categorieën) zo weinig voorkomen dat je ze in de analyse wilt samennemen. Dan moet je de oude variabele hercoderen in een nieuwe variabele. Misschien wil je de analyse maar op een deel van de gegevens uitvoeren, dan moet je eenheden (cases) selecteren. Tenslotte kan het zo zijn dat je verschillende variabelen wilt samennemen in een nieuwe variabele, met name wanneer je een index of een schaal wilt construeren. Deze activiteiten vallen onder de stap 'bewerken'.
  3. Beoordelen.
    Analysetechnieken en toetsen die je wilt gebruiken om de onderzoeksvragen te beantwoorden, stellen soms eisen aan de gegevens. Je moet eerst controleren (beoordelen) of je gegevens aan deze eisen voldoen, voordat je de analysemethode of toets kunt gebruiken.
  4. Beantwoorden van de onderzoeksvragen.
    Voor elke onderzoeksvraag, hypothese of deelvraag moet je een analyse uitvoeren. Meestal gebruik je gegevens uit een (aselecte) steekproef, zodat je een statistische toets moet uitvoeren om te bepalen of de resultaten statistisch significant zijn.

In de bovenstaande stappen werk je soms met afzonderlijke variabelen (univariaat), soms met twee variabelen tegelijkertijd (bivariaat) en soms met drie of meer variabelen tegelijkertijd (multivariaat). Het onderstaande schema geeft een overzicht van de technieken die in BS en IS aan de orde komen en die je aan het einde van de cursus IS moet beheersen.

Om het spoor niet bijster te raken raden we je aan om in het analyseproces de stappen in dit schema steeds systematisch te volgen: eerst univariaat beschrijven, bewerken, beoordelen en eventuele univariate onderzoeksvragen beantwoorden, dan deze stappen bivariaat uit te voeren, tenslotte multivariaat. Natuurlijk hoef je niet in elk onderzoek alle stappen te gebruiken, je zult bijvoorbeeld niet vaak een univariate onderzoeksvraag hebben. Maar het is belangrijk om de stappen die wel relevant zijn in deze vaste volgorde te zetten.

1. Univariaat2. Bivariaat3. Multivariaat
1. Beschrijven (zie BS)- Frequentietabel
- Centrum- en spreidingsmaten
- Grafiek: cirkeldiagram, staafdiagram, lijndiagram, boxplot, histogram
- Kruistabel
- Samengesteld staaf- of lijndiagram
- Spreidingsdiagram
- Correlatiematrix
2. Bewerken (zie ook BS)- Labels aan variabelen en waarden (values) toekennen
- Missing values definiëren (ook voor onmogelijke waarden)
- Hercoderen, groeperen van gegevens
- Cases selecteren
- Standaardiseren (z-scores)
(zie uni- en multivariaat)- Factoranalyse (schaalconstructie)
- Indexvariabele maken
3. Beoordelen- Controle op normale verdeling
- Extreme waarden identificeren
- Aantal waarnemingen in cellen kruistabel
- Varianties gelijk in groepen ((Levene's) F-toets op 2 varianties)
- Vorm verband (lineair)
- Betrouwbaarheid van schaal (Cronbach's alpha)
4. Beantwoorden onderzoeksvraag
(gebruik de manier van rapporteren voorgeschreven in APA6)
- Chikwadraattoets op de frequenties van 1 nominale variabele
- t-toets op 1 gemiddelde
- Toets op een proportie
- Associatiematen (zie BS)
- Toets op een correlatiecoëfficiënt
- Toets op Spearman's rangcorrelatie
- Chikwadraattoets op kruistabel
- Fisher exact-toets
- t-toets op afhankelijke scores
- t-toets op onafhankelijke scores/twee gemiddelden
- (Levene's) F-toets op 2 varianties
- Eenwegs-variantieanalyse
- Enkelvoudige regressieanalyse
- Tabelsplitsing (zie BS)
- Tweewegs-variantieanalyse
- Meervoudige regressieanalyse