Keskisuuntauksen ja hajaantumisen ero

Keskisuuntauksen ja hajaantumisen ero
Keskisuuntauksen ja hajaantumisen ero

Video: Keskisuuntauksen ja hajaantumisen ero

Video: Keskisuuntauksen ja hajaantumisen ero
Video: Москва слезам не верит, 1 серия (FullHD, драма, реж. Владимир Меньшов, 1979 г.) 2024, Marraskuu
Anonim

Keskisuuntaus vs hajonta

Kuvaus- ja päättelytilastoissa käytetään useita indeksejä kuvaamaan tietojoukkoa, joka vastaa sen keskeistä suuntausta, hajontaa ja vinoutta: kolme tärkeintä ominaisuutta, jotka määrittävät tietojoukon jakauman suhteellisen muodon.

Mikä on keskeinen suuntaus?

Keskisuuntaus viittaa ja paikantaa arvojen jakauman keskuksen. Keskiarvo, tila ja mediaani ovat yleisimmin käytettyjä indeksejä kuvaamaan tietojoukon keskeistä suuntausta. Jos tietojoukko on symmetrinen, niin datajoukon mediaani ja keskiarvo ovat samat.

Tietokoneella keskiarvo lasketaan ottamalla kaikkien data-arvojen summa ja jakamalla se sitten tietojen lukumäärällä. Esimerkiksi 10 ihmisen painot (killoina) mitataan 70, 62, 65, 72, 80, 70, 63, 72, 77 ja 79. Tällöin kymmenen ihmisen keskimääräinen paino (killoina) voi olla lasketaan seuraavasti. Painojen summa on 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Keskiarvo=(summa) / (tietojen lukumäärä)=710 / 10=71 (kilogramoina). On selvää, että poikkeavilla arvoilla (datapisteet, jotka poikkeavat normaalista trendistä) on taipumus vaikuttaa keskiarvoon. Siten poikkeavien arvojen läsnä ollessa pelkkä keskiarvo ei anna oikeaa kuvaa tietojoukon keskipisteestä.

Mediaani on datapiste, joka löytyy tietojoukon tarkalleen keskeltä. Yksi tapa laskea mediaani on järjestää datapisteet nousevaan järjestykseen ja paikantaa sitten datapiste keskeltä. Esimerkiksi, jos edellinen tietojoukko on kerran tilattu, näyttää tältä: 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Siksi (70+72)/2=71 on keskellä. Tästä nähdään, että mediaanin ei tarvitse olla tietojoukossa. Poikkeavien arvojen läsnäolo ei vaikuta mediaaniin. Tästä syystä mediaani toimii paremmin keskeisenä mittarina poikkeamien esiintyessä.

Tila on useimmin esiintyvä arvo tietojoukossa. Edellisessä esimerkissä arvot 70 ja 72 esiintyvät molemmat kahdesti, joten molemmat ovat tiloja. Tämä osoittaa, että joissakin jakaumissa on useampi kuin yksi modaaliarvo. Jos tilaa on vain yksi, tietojoukon sanotaan olevan unimodaalinen, tässä tapauksessa tietojoukko on bimodaalinen.

Mitä on dispersio?

Dispersio on hajautettujen tietojen määrä jakauman keskustasta. Alue ja keskihajonta ovat yleisimmin käytetyt hajontamitat.

Alue on yksinkertaisesti suurin arvo miinus pienin arvo. Edellisessä esimerkissä suurin arvo on 80 ja pienin arvo on 62, joten alue on 80-62=18. Mutta vaihteluväli ei anna riittävää kuvaa dispersiosta.

Keskihajonnan laskemiseksi lasketaan ensin data-arvojen poikkeamat keskiarvosta. Poikkeamien juurineliökeskiarvoa kutsutaan keskihajonnaksi. Edellisessä esimerkissä vastaavat poikkeamat keskiarvosta ovat (70 - 71)=-1, (62 - 71)=-9, (65 - 71)=-6, (72 - 71)=1, (80 - 71)=9, (70 - 71)=-1, (63 - 71)=-8, (72 - 71)=1, (77 - 71)=6 ja (79 - 71)=8. poikkeaman neliöt on (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 Keskihajonta on √(366/10)=6,05 (kilogrammoina). Ellei tietojoukko ole suuresti vinossa, tästä voidaan päätellä, että suurin osa tiedoista on välillä 71±6,05, ja niin on tässäkin esimerkissä.

Mitä eroa on keskeisillä suuntauksilla ja hajaannuksella?

• Keskeinen suuntaus viittaa ja paikantaa arvojen jakauman keskuksen

• Dispersio on datajoukon keskustasta leviävän tiedon määrä.

Suositeltava: