Hajonnan tunnusluvut
Hajonnan tunnusluvuilla pyritään ilmaisemaan vaihtelun määrää aineistossa. Jakauman tapauksessa voidaan ajatella myös, kuinka tiukasti tai löyhästi arvot jakautuvat.
Kategoriset muuttujat
Hajonnan tunnuslukuja ei yleensä tarkastella kategoristen eli luokittelevien muuttujien tapauksessa.
Numeeriset muuttujat
Vaihteluvälin pituus on aineiston suurimman ja pienimmän arvon erotus. Se ei voi pienentyä aineiston kasvaessa. Äärimmäiset arvot vaikuttavat suuresti vaihteluvälin pituuteen. Aineiston 1 vaihteluvälin pituus on 172cm - 138 cm = 34cm.
Kvartiilivälin pituus (qr) on yläkvartiilin (q3) ja alakvartiilin (q1) välinen erotus eli vähintään 50 prosenttia aineistosta kuuluu tälle välille. Se ei myöskään ole yhtä herkkä äärimmäisille arvoille kuin vaihteluvälin pituus. Kvartiilipoikkeama on Sekä kvartiilivälin pituus että kvartiilipoikkeama voivat muuttua pienemmiksi tai suuremmiksi, jos aineistoon lisätään havaintoja. Aineistossa 1, kvartiilivälin pituus on ja kvartiilipoikkeama
Havainnon i hajonta on kyseisen arvon ja keskiarvon erotus: Kun näitä erotuksia lasketaan yhteen, niin positiiviset ja negatiiviset arvot kumoavat toisiaan eli hajontaa saatetaan aliarvioida. Tästä syystä erotusten itseisarvot lasketaan yhteen (merkintä tarkoittaa yhteenlaskemista):
Kun hajontoja lasketaan yhteen, niin havaintojen lukumäärällä on suuri vaikutus. Pienessä aineistossa (esim 50 havaintoa) summa jää pienemmäksi kuin suuressa aineistossa(esim. 1000 havaintoa), vaikka hajonnat olisivat samaa suuruusluokkaa. Keskimääräinen poikkeama saadaan, kun yhteenlaskettu hajonta jaetaan havaintojen lukumäärällä. Tämä on vertailukelpoisempi kuin pelkkä summa.
Itseisarvomerkit ovat tarpeettomat, mikäli erotukset korotetaan toiseen. Tällöin puhutaan varianssista. Varianssi ei ole sijainnista riippuvainen. Koko populaation tai suurten otosten varianssia merkitään ja se saadaan kaavalla
missä n on havaintojen lukumäärä.
Jos otoskoko on pieni (< 30 havaintoa), silloin jakajana on n - 1 ja varianssia merkitään :
Koska varianssia laskettaessa korotetaan toiseen, niin myös yksiköt korottuvat toiseen. Tulosta on helpompi tulkita, kun varianssista otetaan neliöjuuri. Tällöin sitä kutsutaan keskihajonnaksi.
Aineiston 1 varianssi on
Tällöin keskihajonta on Koska aineisto 1 on kooltaan pieni, niin käytetään otoksen varianssia ja keskihajontaa. Harjoittele tällä esimerkillä varianssin ja keskihajonnan laskemista taulukkolaskennan avulla!
Joskus halutaan vertailla saman ominaisuuden hajontoja erilaisten yksiköiden tapauksessa. Tämä vertailu on helpointa tehdä variaatiokertoimen (v) avulla:
Variaatiokerroin voidaan laskea, jos muuttuja on vähintään suhdeasteikollinen.
Example: Eräänä vuonna keskimääräiset vuositulos USAssa olivat 20 000 dollaria ja keskihajonta 10 000 dollaria. Saman vuoden keskitulot Britanniassa oli 6000 puntaa ja keskihajonta 4000 puntaa. Jos vertaillaan pelkästään keskihajontoja, niin hajonta USAssa on suurempi. Variaatiokerroin keskituloille USAssa on
ja Britanniassa 0.67. Kun hajonta suhteutetaan keskituloihin variaatiokertoimen avulla, niin keskihajonta on suurempaa Britanniassa.
Vertailu voidaan tehdä samalla tavalla myös samassa yksikössä oleville muuttujille, jos niiden suuruusluokissa on suuri vaihtelu. Esimerkiksi hiirten keskipainon hajonnan vertailu norsujen painon keskihajontaa ei ole järkevää ilman variaatiokerrointa.
