Hajaantuminen vs vinous
Tilastossa ja todennäköisyysteoriassa jakaumien vaihtelu on usein ilmaistava kvantitatiivisesti vertailua varten. Dispersio ja vinous ovat kaksi tilastollista käsitettä, joissa jakauman muoto esitetään kvantitatiivisessa asteikossa.
Lisätietoja dispersiosta
Tilastossa dispersio on satunnaismuuttujan tai sen todennäköisyysjakauman vaihtelua. Se on mitta siitä, kuinka kaukana datapisteet ovat keskusarvosta. Tämän kvantitatiivisen ilmaisemiseksi dispergointimittareita käytetään kuvaavassa tilastossa.
Varianssi, keskihajonta ja kvartiilien välinen alue ovat yleisimmin käytetyt hajontamitat.
Jos data-arvoilla on tietty yksikkö, asteikosta johtuen myös hajontamittauksissa voi olla samat yksiköt. Desiilien välinen alue, Range, keskimääräinen ero, absoluuttisen mediaanipoikkeama, keskimääräinen absoluuttinen poikkeama ja etäisyyden standardipoikkeama ovat yksiköiden hajontamittauksia.
Sitä vastoin on olemassa dispersiomittauksia, joissa ei ole yksikköjä, eli mitattomat. Varianssi, variaatiokerroin, dispersion kvartiilikerroin ja suhteellinen keskimääräinen ero ovat dispersion mittareita, joissa ei ole yksikköä.
Järjestelmän dispersio voi johtua virheistä, kuten instrumentaali- ja havaintovirheistä. Myös satunnaiset vaihtelut itse otoksessa voivat aiheuttaa vaihteluita. On tärkeää, että sinulla on määrällinen käsitys tietojen vaihtelusta ennen kuin teet muita johtopäätöksiä tietojoukosta.
Lisätietoja vinoudesta
Tilastossa vinous on todennäköisyysjakaumien epäsymmetrian mitta. Vino voi olla positiivista tai negatiivista tai joissain tapauksissa olematonta. Sitä voidaan pitää myös normaalijakauman poikkeaman mittana.
Jos vinous on positiivinen, suurin osa datapisteistä on keskitetty käyrän vasemmalle puolelle ja oikea häntä on pidempi. Jos vinous on negatiivinen, suurin osa datapisteistä on keskitetty käyrän oikealle puolelle ja vasen häntä on melko pitkä. Jos vinous on nolla, populaatio jakautuu normaalisti.
Normaalijakaumassa, eli kun käyrä on symmetrinen, keskiarvolla, mediaanilla ja moodilla on sama arvo. Jos vinous ei ole nolla, tämä ominaisuus ei päde, ja keskiarvolla, tilalla ja mediaanilla voi olla eri arvot.
Pearsonin ensimmäistä ja toista vinouskerrointa käytetään yleisesti jakaumien vinouden määrittämiseen.
Pearsonin ensimmäinen vinosuhde=(keskiarvo – tila) / (keskipoikkeama)
Pearsonin toinen vinosuhde=3 (keskiarvo – tila) / (satndard poikkeama)
Herkeimmissä tapauksissa käytetään säädettyä Fisher-Pearsonin standardoitua momenttikerrointa.
G={n / (n-1) (n-2)} ∑i=1 ((y-ӯ)/s)3
Mitä eroa on dispersiolla ja vinoudella?
Dispersio koskee aluetta, jolle datapisteet jakautuvat, ja vinous liittyy jakautumisen symmetriaan.
Sekä hajonta- että vinousmitat ovat kuvaavia mittareita, ja vinouskerroin antaa viitteen jakauman muodosta.
Hajonnan mittaa käytetään ymmärtämään datapisteiden vaihteluväliä ja poikkeamaa keskiarvosta, kun taas vinoutta käytetään ymmärtämään datapisteiden vaihtelua tiettyyn suuntaan.