a. Bevatten de gegevens voldoende aanwijzingen om te kunnen concluderen dat het kooppatroon van het panel representatief is voor de populatie huishoudens? Toets voor α = 0,05.
Bereken de verwachte waarden door het marktaandeel voor elk soort pindakaas te vermenigvuldigen met het totaal aantal aankopen in het panel (19.115).
Bereken dan chikwadraat in de volgende stappen (de gestandaardiseerde celresiduen zijn ook uitgereknd t.b.v. vraag c):
Merk | Inhoud | Aantal aankopen in panel (fo) | Marktaandeel (fe%) | fe | fo - fe | (fo - fe)2 | (fo - fe)2/fe | (fo - fe)/√(fe) |
Jif | 18 oz. | 3165 | 20,1% | 3842,115 | -677,115 | 458484,723 | 119,331 | -10,924 |
Jif | 28 oz. | 1892 | 10,1% | 1930,615 | -38,615 | 1491,118 | 0,772 | -0,879 |
Jif | 40 oz. | 726 | 5,4% | 1032,210 | -306,210 | 93764,564 | 90,839 | -9,531 |
Peter Pan | 10 oz. | 4079 | 16,0% | 3058,400 | 1020,600 | 1041624,360 | 340,578 | 18,455 |
Skippy | 18 oz. | 6206 | 28,7% | 5486,005 | 719,995 | 518392,800 | 94,494 | 9,721 |
Skippy | 28 oz. | 1627 | 12,4% | 2370,260 | -743,260 | 552435,428 | 233,070 | -15,267 |
Skippy | 40 oz. | 1420 | 7,3% | 1395,395 | 24,605 | 605,406 | 0,434 | 0,659 |
Totaal | 19115 | 100% | 19115 | χ2 = 879,518 |
Het aantal vrijheidsgraden is 7 - 1 = 6. De kritieke waarde van chikwadraat bij een significantieniveau (α) van 5% is 12,59 (zie tabel), dus de berekende chikwadraatwaarde ligt ver in het kritieke gebied.
We verwerpen de nulhypothese dat de proporties van de pindakaasmerken bij de aankopen van het panel overeenkomen met hun marktaandelen. Wat betreft de pindakaas-aankopen is het panel dus niet representatief voor de populatie huishoudens.
b. Aan welke aannames moet zijn voldaan opdat de toetsingsprocedure in a geldig is?
80% van de verwachte waarden moeten minstens 5 zijn en geen enkele verwachte waarde mag lager zijn dan 1. Daar is ruimschoots aan voldaan.
Verder moet het panel natuurlijk een aselecte steekproef zijn uit alle huishoudens.
c. Geef op grond van de tussenuitkomsten uit de berekening aan bij welk merk het panel relatief het meest afwijkt van de populatie huishoudens en bij welk merk het panel het minst afwijkt van de populatie huishoudens.
Kijk naar de laatste stap bij het uitrekenen van chikwadraat, waarin je voor elk merk (elke categorie) ziet wat de bijdrage is aan chikwadraat. Hoe groter die bijdrage, des te groter is de discrepantie tussen de waargenomen en de verwachte waarde.
119,331 + 0,772 + 92,777 + 339,091 + 97,289 + 231,051 + 0,309 = 880,62
Het vierde merk (Peter Pan) heeft de grootste bijdrage aan de chikwadraat (339,091). Hier is het relatieve verschil tussen de aankopen van het panel en de aankopen van de populatie het grootst. Wanneer we het aandeel van dit merk bij het panel uitrekenen (100% * 4079 / 19115 = 21,34%) blijkt dit beduidend hoger te liggen dan bij de populatie van huishoudens (16,01%).
Het zevende merk (Skippy 40 oz.) heeft de kleinste bijdrage aan chikwadraat (0,309). Hier zijn de waargenomen (1420) en verwachte waarde (1399,218) bijna gelijk.
Je zou ook naar de gestandaardiseerde celresiduen kunnen kijken, zoals bij de chikwadraattoets op de kruistabel. Het enige verschil is dan dat je niet deelt door de verwachte frequentie maar door de wortel van de verwachte frequentie.
De gestandaardiseerde celfrequenties zijn duidelijk significant (absoluut groter dan 1.96) bij Jif 18 oz. en 40 oz., Peter Pan en Skippy 18 oz. en 28 oz.