Tilastolliset käsitteet
Populaatiolla tarkoitetaan koko sitä ryhmää, josta tilastollinen tutkimus on tehty. Jos puhutaan
19-vuotiaista, niin populaatio on maailman kaikki 19-vuotiaat. Kuten jo esimerkistä selviää, niin tutkimukseen on mahdotonta saada koko populaation tietoja. Tämän takia tilastollisissa tutkimuksissa käytetään otosta, jolloin pienemmällä joukolla pyritään kuvaamaan kyseessä olevan populaation tietoja.
Otos (ja myös populaatio) koostuu havainnoista. Havainto on esimerkiksi yhden 19-vuotiaan kaikki kerätyt tiedot, kuten sukupuoli, pituus, kotikunta jne. Tilastollinen muuttuja on ominaisuus, jonka arvo vaihtelee eri havaintojen kohdalla. Esimerkiksi kuvan 1 otoksessa on tilastollisina muuttujina sukupuoli, koulutus, ammatti ja palkka. Sukupuoli voi tämän kuvan perusteella olla joko nainen tai mies. Koulutus vaihtelee peruskoulun, toisen asteen ja kolmannen asteen koulutuksen välillä.

Tilastolliset muuttujat
Ostamani omenat olivat puolet halvempia kuin päärynät mutta kaksi kertaa maukkaampia.Kun olet tekemisissä tilastollisen aineiston kanssa, niin sinun TÄYTYY olla tietoinen, minkälaisia muuttujia on käytetty/käytetään. Yllä olevassa lauseessa hinta on numeerinen muuttuja mutta maukkaus on luokitteleva eli kategorinen muuttuja. Luokittelevien muuttujien vertailu yllä mainitulla tavalla on mahdotonta. Mitä edes tarkoittaa kaksi kertaa maukkaampi? Onko minun "kaksi kertaa maukkaampi" sinun maukas vai mauttomampi?

Kuten kuvasta 2 huomataan, niin tilastolliset muuttujat jaetaan luokitteleviin (eli kategorisiin) ja numeerisiin muuttujiin.
Luokittelevat muuttujat jakavat havainnot toisensa poissulkeviin ryhmiin (sukupuoli, mielipide jne.) Esimerkiksi yliopisto-opiskelijan koulutusohjelma on laatuero- eli nominaaliasteikollinen , koska se jakaa opiskelijat vain pääaineen mukaan eri ryhmiin. Jos ryhmät voitaisiin lajitella loogiseen järjestykseen, muuttujan sanotaan olevan järjestysasteikollinen. Esimerkiksi koulutuksella on looginen järjestys: peruskoulu, lukio, korkea-aste jne.
Numeeriset muuttujat ovat luonnollisesti reaalilukuja (kuten esimerkiksi palkka kuvan 1 aineistossa):
- Jos ominaisuus ei katoa nollassa, niin muuttuja on välimatka-asteikollinen (lämpötila). Todellisten arvojen suhteella ei ole merkitystä.
- Jos ominaisuus "häviää" arvolla 0, muuttuja on suhdeasteikolla. Todellisten arvojen suhteella on merkitys: esine A 15 kg, esine B 45 kg => esine B 3 kertaa raskaampi kuin kohde A. Muuttujien yksikkö aikavälillä tai suhdeasteikolla ei ole kiinteä. Esimerkiksi paino voidaan antaa kilogrammoina tai paunoina.
- Jos muuttuja käyttäytyy kuten suhdeasteikolla MUTTA yksikkö on yksikäsitteinen, niin muuttuja on absoluuttisessa asteikossa (ihmisten lukumäärä).