Antwoord

Antwoord bij rekenopgave 4.2

a. Bevatten de gegevens voldoende aanwijzingen om te kunnen concluderen dat het kooppatroon van het panel representatief is voor de populatie huishoudens? Toets voor α = 0,05.

Bereken de verwachte waarden door het marktaandeel voor elk soort pindakaas te vermenigvuldigen met het totaal aantal aankopen in het panel (19.115).
Bereken dan chikwadraat in de volgende stappen (de gestandaardiseerde celresiduen zijn ook uitgereknd t.b.v. vraag c):

Merk Inhoud Aantal aankopen in panel (f_o) Marktaandeel (f_e%) f_e f_o - f_e (f_o - f_e)² (f_o - f_e)²/f_e (f_o - f_e)/√(f_e)

Jif 18 oz. 3165 20,1% 3842,115 -677,115 458484,723 119,331 -10,924

Jif 28 oz. 1892 10,1% 1930,615 -38,615 1491,118 0,772 -0,879

Jif 40 oz. 726 5,4% 1032,210 -306,210 93764,564 90,839 -9,531

Peter Pan 10 oz. 4079 16,0% 3058,400 1020,600 1041624,360 340,578 18,455

Skippy 18 oz. 6206 28,7% 5486,005 719,995 518392,800 94,494 9,721

Skippy 28 oz. 1627 12,4% 2370,260 -743,260 552435,428 233,070 -15,267

Skippy 40 oz. 1420 7,3% 1395,395 24,605 605,406 0,434 0,659

Totaal 19115 100% 19115 χ² = 879,518

NB hier zijn tussenresultaten steeds afgerond op 3 decimalen.

Het aantal vrijheidsgraden is 7 - 1 = 6. De kritieke waarde van chikwadraat bij een significantieniveau (α) van 5% is 12,59 (zie tabel), dus de berekende chikwadraatwaarde ligt ver in het kritieke gebied.
We verwerpen de nulhypothese dat de proporties van de pindakaasmerken bij de aankopen van het panel overeenkomen met hun marktaandelen. Wat betreft de pindakaas-aankopen is het panel dus niet representatief voor de populatie huishoudens.

b. Aan welke aannames moet zijn voldaan opdat de toetsingsprocedure in a geldig is?

80% van de verwachte waarden moeten minstens 5 zijn en geen enkele verwachte waarde mag lager zijn dan 1. Daar is ruimschoots aan voldaan.
Verder moet het panel natuurlijk een aselecte steekproef zijn uit alle huishoudens.

c. Geef op grond van de tussenuitkomsten uit de berekening aan bij welk merk het panel relatief het meest afwijkt van de populatie huishoudens en bij welk merk het panel het minst afwijkt van de populatie huishoudens.

Kijk naar de laatste stap bij het uitrekenen van chikwadraat, waarin je voor elk merk (elke categorie) ziet wat de bijdrage is aan chikwadraat. Hoe groter die bijdrage, des te groter is de discrepantie tussen de waargenomen en de verwachte waarde.
119,331 + 0,772 + 92,777 + 339,091 + 97,289 + 231,051 + 0,309 = 880,62
Het vierde merk (Peter Pan) heeft de grootste bijdrage aan de chikwadraat (339,091). Hier is het relatieve verschil tussen de aankopen van het panel en de aankopen van de populatie het grootst. Wanneer we het aandeel van dit merk bij het panel uitrekenen (100% * 4079 / 19115 = 21,34%) blijkt dit beduidend hoger te liggen dan bij de populatie van huishoudens (16,01%).
Het zevende merk (Skippy 40 oz.) heeft de kleinste bijdrage aan chikwadraat (0,309). Hier zijn de waargenomen (1420) en verwachte waarde (1399,218) bijna gelijk.

Je zou ook naar de gestandaardiseerde celresiduen kunnen kijken, zoals bij de chikwadraattoets op de kruistabel. Het enige verschil is dan dat je niet deelt door de verwachte frequentie maar door de wortel van de verwachte frequentie.
De gestandaardiseerde celfrequenties zijn duidelijk significant (absoluut groter dan 1.96) bij Jif 18 oz. en 40 oz., Peter Pan en Skippy 18 oz. en 28 oz.

Merk	Inhoud	Aantal aankopen in panel (f_o)	Marktaandeel (f_e%)	f_e	f_o - f_e	(f_o - f_e)²	(f_o - f_e)²/f_e	(f_o - f_e)/√(f_e)
Jif	18 oz.	3165	20,1%	3842,115	-677,115	458484,723	119,331	-10,924
Jif	28 oz.	1892	10,1%	1930,615	-38,615	1491,118	0,772	-0,879
Jif	40 oz.	726	5,4%	1032,210	-306,210	93764,564	90,839	-9,531
Peter Pan	10 oz.	4079	16,0%	3058,400	1020,600	1041624,360	340,578	18,455
Skippy	18 oz.	6206	28,7%	5486,005	719,995	518392,800	94,494	9,721
Skippy	28 oz.	1627	12,4%	2370,260	-743,260	552435,428	233,070	-15,267
Skippy	40 oz.	1420	7,3%	1395,395	24,605	605,406	0,434	0,659
Totaal		19115	100%	19115			χ² = 879,518