Antwoord bij oefening 5.2

a. Voer een analyse uit, rapporteer de resultaten op de voorgeschreven wijze en beantwoord daarmee de vraag van de onderzoeker.

We hebben hier een interval/ratio afhankelijke variabele (koopgeneigdheid) en een categorische onafhankelijke variabele (versie van de reclamecampagne) met vier groepen (campagne A tot en met D). Hiermee kunnen we een eenwegs-variantieanalyse uitvoeren. Met deze analyse toetsen we of de campagnes in de populatie gemiddeld dezelfde koopgeneigdheid opleveren. Wanneer we deze nulhypothese kunnen verwerpen, weten we dat de campagnes niet even geschikt zijn om het product aan te prijzen. We kunnen dan via post-hoc toetsen nagaan welke campagne(s) de meeste koopgeneigdheid oproept.

De groepen zijn even groot dus hoeven we ons geen zorgen te maken over gelijke varianties in de populatie. Volgens de tekst van de opgave zijn de steekproeven aselect getrokken, dus nemen we aan dat ze onafhankelijk van elkaar zijn getrokken. We kunnen variantieanalyse hier dus toepassen.

Eenwegs-variantieanalyse

De benodigde gegevens (de kwadratensommen) zijn gegeven. We kunnen de samenvattende tabel direct invullen.

  Kwadratensom df Gemiddelde kwadratensom (MS) F p
Tussen groepen (SSb) 90,635 3 30,212 7,056 p < 0,05
Binnen groepen (SSw) 496,666 116 4,282    
Totaal (SSt) 587,301 119      

De F-toets is significant dus mogen we uitgaan van verschillende gemiddelden in de populatie. Met andere woorden, ook in de populatie roept de ene reclamecampagne meer koopgeneigdheid op dan de andere.
Wanneer we naar de steekproefgemiddelden kijken, roept campagne C gemiddeld de meeste koopgeneigdheid op. Maar is dit significant meer dan campagne B, de campagne die als tweede scoort? Zo ja, dan is campagne C de beste keus. Zo niet, dan zijn campagnes B en C goede keuzen.
Voer een toets met Bonferroni correctie uit de gemiddelden van deze twee campagnes. Wanneer je maar één toets uitvoert (k = 1), kun je overigens gewoon 5% significantieniveau handhaven want de Bonferroni correctie is dan α / k = 5% / 1 = 5%.

Aangezien de steekproefomvang voor de twee groepen samen vrijwel tussen 30 en 100 ligt (de groepen zitten met ieder 30 waarnemingen eigenlijk net onder het vereiste aantal in de vuistregel) mogen we een t-toets op twee gemiddelden uitvoeren zonder dat we ons zorgen hoeven te maken of de koopgeneigdheid in de populatie wel normaal verdeeld is.
Bij een t-toets op het verschil tussen twee gemiddelden moeten we eerst nagaan of de varianties van beide groepen in de populatie gelijk kunnen zijn. Hier hangt namelijk de berekening van de standaardfout van af. Dus voeren we eerst een F-toets voor twee varianties uit.

F-toets op gelijke varianties

  1. Stap 1: Specificeer de hypothesen.
    H0: σ2campagne B = σ2campagne C
    H1: σ2campagne B ≠ σ2campagne C
  2. Stap 2: Kies de kansverdeling.
    Bij een F-toets hoort de F-verdeling.
  3. Stap 3: Bepaal de kritieke waarde en het verwerpingsgebied.
    Bepaal het aantal vrijheidsgraden. Dat is hier 30 - 1 = 29 voor zowel de teller als de noemer aangezien beide groepen even groot zijn.
    Zoek de kritieke waarde van F op in de significantietabel bij het gegeven of gekozen significantieniveau. Let op of de toets eenzijdig is of tweezijdig. Dit is 1,9 (als je kijkt bij df1 = 24 en df2 = 29).
    Bepaal het verwerpingsgebied. Het verwerpingsgebied is dan F ≥ 1,9 .
  4. Stap 4: Bereken de toetsingsgrootheid F voor de steekproef.
    Vul de formule voor F in:
  5. Stap 5: Ga na of de berekende F-waarde in het verwerpingsgebied valt:
    F valt hier niet in het kritieke gebied dus we verwerpen de nulhypothese niet dat de groepen in de populatie gelijke varianties hebben. Kortom, we mogen uitgaan van gelijke varianties in de populatie.

t-toets op twee gemiddelden

Nu kunnen we de t-toets uitvoeren met gepoolde variantie.

  1. Stap 1: Specificeer de hypothesen.
    H0: μcampagne B = μcampagne C
    H1: μcampagne B ≠ μcampagne C
  2. Stap 2: Kies de kansverdeling.
    De t-verdeling hoort bij de t-toets.
  3. Stap 3: Bepaal de kritieke waarde en het verwerpingsgebied.
    Bepaal het aantal vrijheidsgraden: df = n1 + n2 - 2 = 30 + 30 - 2 = 58.
    Zoek de kritieke waarde van t op in de significantietabel bij het gegeven of gekozen significantieniveau. Let op of de toets eenzijdig is of tweezijdig. We gaan uit van een tweezijdige toets met 5% significantieniveau. Dan is de kritieke waarde van t = 2,002 .
    Bepaal het verwerpingsgebied: t ≥ 2,002 of t ≤ -2,002.
  4. Stap 4: Bereken de toetsingsgrootheid t voor de steekproef.
    Bepaal eerst de gepoolde variantie (NB wanneer de twee groepen even groot zijn, komt dit neer op het gemiddelde van de varianties van beide groepen):

    Bereken vervolgens de standaardfout:

    Vul tenslotte de formule voor t in:
  5. Stap 5: Ga na of de berekende t-waarde in het verwerpingsgebied valt:
    De berekende waarde van t ligt in het verwerpingsgebied dus verwerpen we de nulhypothese dat de twee gemiddelden in de populatie gelijk zijn. Campagne C scoort dus significant hoger dan campagne B wat betreft koopgeneigdheid. De effectgrootte hierbij is: η2 = SSb / SSt = 90,635 / 587,301 = 0,154.

Conclusie

We hebben een eenwegs-variantie uitgevoerd waaruit significant verschillende gemiddelden naar voren kwamen, F (3, 116) = 7,06, p < 0,05, η2 = 0,15. Op basis van de effectgrootte, kan geconcludeerd worden dat deze verschillen middelmatig tot groot zijn. Uit een post-hoc toets bleek dat campagne C (M = 4,93, SD = 1,83) significant meer koopgeneigdheid bij de proefpersonen oplevert dan de daarop volgende campagne B (M = 3,31, SD = 2,14), t (58) = -3,16, p < 0,05.

Antwoord aan de onderzoeker

Campagne C is de beste keuze om het product te verkopen omdat de gemiddelde koopgeneigdheid na het zien van deze campagne het hoogste is.