Antwoord bij rekenopgave 3.2e

a. Construeer een 99% betrouwbaarheidsinterval voor het gemiddelde loodgehalte in watermonsters uit Crystal Lake Manors.

We mogen een t-verdeling gebruiken om de betrouwbaarheidsintervallen rond de populatiegemiddelden te schatten omdat de opgave stelt dat de verdeling in de populatie van beide variabelen normaal is.
Bepaal eerst de standaarddeviatie voor beide metaalsoorten, wat het snelste gaat met de berekeningsformule.

  Lood Koper
  xi xi2 xi xi2
Huis1 1,320 1,742 0,508 0,258
Huis2 0,000 0,000 0,279 0,078
Huis3 13,100 171,610 0,320 0,102
Huis4 0,919 0,845 0,904 0,817
Huis5 0,657 0,432 0,221 0,049
Huis6 3,000 9,000 0,283 0,080
Huis7 1,320 1,742 0,475 0,226
Huis8 4,090 16,728 0,130 0,017
Huis9 4,450 19,803 0,220 0,048
Huis10 0,000 0,000 0,743 0,552
Som 28,856 221,902 4,083 2,227
Som/N 2,886 22,190 0,408 0,223

De berekening van de geschatte standaardafwijking van het loodgehalte:

De berekening voor het kopergehalte:

Opzoeken t-waarde (3,250) en formule invullen:

Het betrouwbaarheidsinterval voor het loodgehalte is [-1,15, 6,92].

b. Construeer een 99% betrouwbaarheidsinterval voor het gemiddelde kopergehalte in watermonsters uit Crystal Lake Manors.

De t-waarde is hier hetzelfde als bij a want de omvang van de steekproef (en dus het aantal vrijheidsgraden) verandert niet, net zomin als het betrouwbaarheidsniveau.

Formule invullen:

Het betrouwbaarheidsinterval voor het kopergehalte is [0,15, 0,67].

c. Interpreteer de intervallen in a en b in termen van de vraagstelling.

We zijn 99% zeker dat het ware gemiddelde kopergehalte boven de nul ligt, namelijk tussen de 0,15 en 0,67. De onderzoekers zullen dus concluderen dat sprake is van kopervervuiling.
We zijn 99% zeker dat het ware gemiddelde loodgehalte tussen de -1,15 en 6,92 ligt. Het ware gemiddelde loodgehalte kan dus nul zijn.
LET OP: Het loodgehalte kan natuurlijk niet lager dan 0 zijn, dus als we in een steekproef loodgehaltes boven de nul vinden zal het gemiddelde altijd boven de nul zijn. Als echter in heel weinig huizen het loodgehalte iets boven de nul ligt en in heel veel huizen het loodgehalte 0 is, zal het gemiddelde heel erg dicht bij 0 liggen. Op grond van de gegevens is het goed mogelijk dat het ware gemiddelde heel erg dicht bij nul ligt. Misschien is loodgehalte niet goed gemeten, bijvoorbeeld met een ondeugdelijk meetinstrument.

d. Leg uit wat de term "99% betrouwbaarheid" betekent.

99% betrouwbaarheid betekent statistisch gezien dat in 99% van een oneindig aantal steekproeven (met dezelfde N) het ware gemiddelde binnen het voor die steekproef berekende interval om het steekproefgemiddelde valt. Anders gesteld, als we oneindig veel stekeproeven van 10 waarnemingen zouden trekken en voor iedere steekproef ene betrouwbaarheidsinterval zouden berekenen, dan zou in 1% van de gevallen het ware populatiegemiddelde niet binnen het betrouwbaarheidsinterval vallen.
Inhoudelijk zeggen we dan dat we 99% zeker zijn dat het ware gemiddelde (populatiegemiddelde) in het gegeven interval valt.

e. Kunnen we op grond van de resultaten met 99% zekerheid concluderen dat het loodgehalte in al het drinkwater gemiddeld hoger is dan het kopergehalte?

Nee. Wanneer we de twee betrouwbaarheidsintervallen vergelijken, kunnen we heel goed situaties verzinnen waarbij het ware gemiddelde loodgehalte lager is dan het ware kopergehalte terwijl we 99% zeker zijn over deze gemiddelden. Het ware loodgehalte kan bijvoorbeeld gemiddeld 0,3 zijn want dit ligt in het betrouwbaarheidsinterval [-1,15, 6,92] en het ware kopergehalte kan bijvoorbeeld gemiddeld 0,5 zijn want dit ligt in het betrouwbaarheidsinterval [0,15, 0,67].