7al: toepassing BMI - Z toets
geïmporteerd csv-bestand
- Op de pagina https://people.sc.fsu.edu/~jburkardt/data/csv/csv.html, vind je in het 16e bestand voor 200 mensen respectievelijk een indexnummer, hun lengte en hun gewicht.
- Deze gegevens werden statistisch verwerkt op de pagina 4t: csv-databestanden: Op vernoemde pagina vind je terug hoe voor deze proefgroep de BMI berekend werd.
Vraagstelling
Vanuit de BMI steekproefgegevens kan je nu een hypothesetoets toepassen.
- Stel: we gaan uit van een BMI met als gemiddelde 20 en als standaardafwijking 5.
- Het gemeten steekproefgemiddelde is echter 19.36, dus lager dan het aangenomen gemiddelde van 20.
- De nulhypothese is: .
- De alternatieve hypothese is .
- Omdat de alternatieve aanname kleiner is dan de nulhypothese nemen we als staart "<".
- Als significantieniveau nemen we 0.05 (5%).
Uitwerking van de hypothesetoets
ZToetsGemiddelde(steekproefgemiddelde,, steekproefgrootte, hypothetisch gemiddelde) geeft als resultaat .
Dit kan je lezen als:
- De testwaarde, m.a.w. de gestandaardiseerde waarde van het steekproefgemiddelde, is -1.81019.
- In de standaardnormale verdeling is de waarschijnlijkheid van een waarde kleiner dan deze testwaarde gelijk aan 3.5%. Omdat deze waarde kleiner is dan 5% verwerpen we het aangenomen gemiddelde van 20 als BMI. M.a.w. het steekproefgemiddelde is te afwijkend van het aangenomen gemiddelde om te blijven vasthouden aan dat aangenomen gemiddelde.
de marge tussen aannemen en verwerpen
De marge tussen 20 en 19.9 is erg klein. Dit komt door enerzijds de kleine waarden bij het rekenen met BMI -waarden en anderzijds vooral de grootte van de steekproef.
Met 200 als steekproefgrootte wordt, door de centrale limietstelling de standaardafwijking
Verander je in onderstaand applet het hypothetisch gemiddeld van 20 naar 19.9, dan krijg je een kans van 6.3%. Het steekproefresultaat is nog steeds afwijkend, maar niet voldoende afwijkend meer om het aangenomen gemiddelde te verwerpen.
De relevantie van deze Z toets is bij deze gegevens erg betwistbaar. Ook in statistiek gebruik je best niet alleen formules, maar ook je gezond verstand.
Vanuit hetzelfde csv-bestand kan je nu zelf aan de slag met lengte en/of gewicht apart.
Experimenteer met andere bestanden om csv bestanden te verwerken.