Antwoord bij rekenopgave 4.2

a. Bevatten de gegevens voldoende aanwijzingen om te kunnen concluderen dat het kooppatroon van het panel representatief is voor de populatie huishoudens? Toets voor α = 0,05.

Bereken de verwachte waarden door het marktaandeel voor elk soort pindakaas te vermenigvuldigen met het totaal aantal aankopen in het panel (19.115).
Bereken dan chikwadraat in de volgende stappen (de gestandaardiseerde celresiduen zijn ook uitgereknd t.b.v. vraag c):

Merk Inhoud Aantal aankopen in panel (fo) Marktaandeel (fe%) fe fo - fe (fo - fe)2 (fo - fe)2/fe (fo - fe)/√(fe)
Jif 18 oz. 3165 20,1% 3842,115 -677,115 458484,723 119,331 -10,924
Jif 28 oz. 1892 10,1% 1930,615 -38,615 1491,118 0,772 -0,879
Jif 40 oz. 726 5,4% 1032,210 -306,210 93764,564 90,839 -9,531
Peter Pan 10 oz. 4079 16,0% 3058,400 1020,600 1041624,360 340,578 18,455
Skippy 18 oz. 6206 28,7% 5486,005 719,995 518392,800 94,494 9,721
Skippy 28 oz. 1627 12,4% 2370,260 -743,260 552435,428 233,070 -15,267
Skippy 40 oz. 1420 7,3% 1395,395 24,605 605,406 0,434 0,659
Totaal   19115 100% 19115     χ2 = 879,518  

NB hier zijn tussenresultaten steeds afgerond op 3 decimalen.

Het aantal vrijheidsgraden is 7 - 1 = 6. De kritieke waarde van chikwadraat bij een significantieniveau (α) van 5% is 12,59 (zie tabel), dus de berekende chikwadraatwaarde ligt ver in het kritieke gebied.
We verwerpen de nulhypothese dat de proporties van de pindakaasmerken bij de aankopen van het panel overeenkomen met hun marktaandelen. Wat betreft de pindakaas-aankopen is het panel dus niet representatief voor de populatie huishoudens.

b. Aan welke aannames moet zijn voldaan opdat de toetsingsprocedure in a geldig is?

80% van de verwachte waarden moeten minstens 5 zijn en geen enkele verwachte waarde mag lager zijn dan 1. Daar is ruimschoots aan voldaan.
Verder moet het panel natuurlijk een aselecte steekproef zijn uit alle huishoudens.

c. Geef op grond van de tussenuitkomsten uit de berekening aan bij welk merk het panel relatief het meest afwijkt van de populatie huishoudens en bij welk merk het panel het minst afwijkt van de populatie huishoudens.

Kijk naar de laatste stap bij het uitrekenen van chikwadraat, waarin je voor elk merk (elke categorie) ziet wat de bijdrage is aan chikwadraat. Hoe groter die bijdrage, des te groter is de discrepantie tussen de waargenomen en de verwachte waarde.
119,331 + 0,772 + 92,777 + 339,091 + 97,289 + 231,051 + 0,309 = 880,62
Het vierde merk (Peter Pan) heeft de grootste bijdrage aan de chikwadraat (339,091). Hier is het relatieve verschil tussen de aankopen van het panel en de aankopen van de populatie het grootst. Wanneer we het aandeel van dit merk bij het panel uitrekenen (100% * 4079 / 19115 = 21,34%) blijkt dit beduidend hoger te liggen dan bij de populatie van huishoudens (16,01%).
Het zevende merk (Skippy 40 oz.) heeft de kleinste bijdrage aan chikwadraat (0,309). Hier zijn de waargenomen (1420) en verwachte waarde (1399,218) bijna gelijk.

Je zou ook naar de gestandaardiseerde celresiduen kunnen kijken, zoals bij de chikwadraattoets op de kruistabel. Het enige verschil is dan dat je niet deelt door de verwachte frequentie maar door de wortel van de verwachte frequentie.
De gestandaardiseerde celfrequenties zijn duidelijk significant (absoluut groter dan 1.96) bij Jif 18 oz. en 40 oz., Peter Pan en Skippy 18 oz. en 28 oz.