Standardipoikkeama vs keskiarvo
Kuvaus- ja päättelytilastoissa käytetään useita indeksejä kuvaamaan tietojoukkoa, joka vastaa sen keskeistä suuntausta, hajontaa ja vinoutta. Tilastopäätelmissä nämä tunnetaan yleisesti estimaattoreina, koska ne arvioivat populaatioparametrien arvot.
Keskisuuntaus viittaa ja paikantaa arvojen jakauman keskuksen. Keskiarvo, tila ja mediaani ovat yleisimmin käytettyjä indeksejä kuvaamaan tietojoukon keskeistä suuntausta. Dispersio on datan leviämisen määrä jakauman keskustasta. Alue ja keskihajonta ovat yleisimmin käytetyt hajontamitat. Pearsonin vinouskertoimia käytetään kuvaamaan datajakauman vinoutta. Tässä vinoudella tarkoitetaan sitä, onko tietojoukko symmetrinen keskustan suhteen vai ei, ja jos ei, kuinka vinossa se on.
Mitä tarkoittaa?
Keskiarvo on yleisimmin käytetty keskeisen suuntauksen indeksi. Kun tietojoukko on annettu, keskiarvo lasketaan ottamalla kaikkien data-arvojen summa ja jakamalla se sitten tietojen lukumäärällä. Esimerkiksi 10 ihmisen painot (killoina) mitataan 70, 62, 65, 72, 80, 70, 63, 72, 77 ja 79. Tällöin kymmenen ihmisen keskimääräinen paino (killoina) voi olla lasketaan seuraavasti. Painojen summa on 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Keskiarvo=(summa) / (tietojen lukumäärä)=710 / 10=71 (kilogramoina).
Kuten tässä esimerkissä, tietojoukon keskiarvo ei välttämättä ole joukon datapiste, mutta se on yksilöllinen tietylle tietojoukolle. Keskiarvolla on samat yksiköt kuin alkuperäisillä tiedoilla. Siksi se voidaan merkitä samalle akselille kuin data ja sitä voidaan käyttää vertailuissa. Tietojoukon keskiarvolle ei myöskään ole merkkirajoitusta. Se voi olla negatiivinen, nolla tai positiivinen, koska tietojoukon summa voi olla negatiivinen, nolla tai positiivinen.
Mikä on keskihajonta?
Standardipoikkeama on yleisimmin käytetty hajontaindeksi. Keskihajonnan laskemiseksi lasketaan ensin data-arvojen poikkeamat keskiarvosta. Poikkeamien neliökeskiarvoa kutsutaan standardipoikkeamaksi.
Edellisessä esimerkissä vastaavat poikkeamat keskiarvosta ovat (70-71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 ja (79-71)=8. Poikkeaman neliöiden summa on (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Keskihajonta on √(366/10)=6,05 (kilogramoina). Tästä voidaan päätellä, että suurin osa tiedoista on välillä 71±6.05, edellyttäen että tietojoukko ei ole kovin vinossa, ja se on todellakin niin tässä esimerkissä.
Koska keskihajonnan yksiköt ovat samat kuin alkuperäisillä tiedoilla, se antaa meille mittarin siitä, kuinka paljon data poikkeaa keskustasta; mitä suurempi keskihajonta suurempi dispersio. Myös keskihajonta on ei-negatiivinen arvo tietojoukon tietojen luonteesta riippumatta.
Mitä eroa on keskihajonnan ja keskiarvon välillä?
• Keskihajonta on hajaantumisen mitta keskustasta, kun taas keskiarvo mittaa tietojoukon keskikohdan sijaintia.
• Keskihajonta on aina ei-negatiivinen arvo, mutta keskiarvo voi olla mikä tahansa todellinen arvo.