Keskiarvon, mediaanin ja tilan ero

Keskiarvon, mediaanin ja tilan ero
Keskiarvon, mediaanin ja tilan ero

Video: Keskiarvon, mediaanin ja tilan ero

Video: Keskiarvon, mediaanin ja tilan ero
Video: 6 (x) Puolisuunnikkaan piiri ja pinta-ala kuvasta. 2024, Marraskuu
Anonim

Keskiarvo vs mediaani vs. tila

Keskiarvo, mediaani ja tila ovat kuvailevissa tilastoissa käytetyt keskeiset trendit. Ne ovat täysin erilaisia, ja tapaukset, joissa niitä käytetään tietojen yhteenvetoon, ovat myös erilaisia.

Mean

Aritmeettinen keskiarvo on data-arvojen summa jaettuna tietoarvojen lukumäärällä, eli

[lateksi]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]

Jos tiedot ovat näyteavaruudesta, sitä kutsutaan otoskeskiarvoksi ([lateksi]\bar{x} [/lateksi]), joka on otosta kuvaava tilasto. Vaikka se on yleisimmin käytetty kuvaava mitta otosta, se ei ole vankka tilasto. Se on erittäin herkkä poikkeaville ja värähtelyille.

Ajatellaan esimerkiksi tietyn kaupungin asukkaiden keskimääräisiä tuloja. Koska kaikki data-arvot lasketaan yhteen ja sitten jaetaan, äärimmäisen varakkaan henkilön tulot vaikuttavat keskiarvoon merkittävästi. Siksi keskiarvot eivät aina ole hyvä esitys tiedoista.

Lisäksi vaihtosignaalin tapauksessa elementin läpi kulkeva virta vaihtelee ajoittain positiivisesta suunnasta negatiiviseen suuntaan ja päinvastoin. Jos otamme keskimääräisen virran, joka kulkee elementin läpi yhdessä jaksossa, se antaa arvoksi 0, mikä tarkoittaa, että virtaa ei ole kulkenut elementin läpi, mikä ei tietenkään pidä paikkaansa. Siksi myös tässä tapauksessa aritmeettinen keskiarvo ei ole hyvä mitta.

Aritmeettinen keskiarvo on hyvä indikaattori, kun tiedot ovat jakautuneet tasaisesti. Normaalijakaumassa keskiarvo on yhtä suuri kuin moodi ja mediaani. Sillä on myös pienimmät jäännösarvot, kun otetaan huomioon neliövirhe; siksi paras kuvaava mitta, kun tietojoukko on esitettävä yhdellä numerolla.

Mediaani

Keskimmäisen datapisteen arvot sen jälkeen, kun kaikki tietoarvot on järjestetty nousevaan järjestykseen, määritellään tietojoukon mediaaniksi. Mediaani on 2. kvartiili, 5. desiili ja 50. prosenttipiste.

• Jos havaintojen (datapisteiden) määrä on pariton, niin mediaani on tarkkaan järjestetyn listan keskellä oleva havainto.

• Jos havaintojen (datapisteiden) määrä on parillinen, mediaani on järjestetyn listan kahden keskimmäisen havainnon keskiarvo.

Mediaani jakaa havainnon kahteen ryhmään; eli ryhmä (50 %) mediaania korkeampia arvoja ja ryhmä (50 %) pienempiä arvoja. Mediaaneja käytetään erityisesti vääristyneissä jakaumissa, ja ne edustavat dataa melko paremmin kuin aritmeettinen keskiarvo.

Tila

Mode on eniten esiintyvä luku havaintosarjassa. Tietojoukon tila lasketaan etsimällä kunkin joukon elementin taajuus.

• Jos mitään arvoa ei esiinny useammin kuin kerran, tietojoukolla ei ole tilaa.

• Muutoin mikä tahansa arvo, joka esiintyy suurimmalla taajuudella, on tietojoukon tila.

Yhdessä sarjassa voi olla enemmän kuin 1 tila; siksi tila ei ole tietojoukon ainutlaatuinen tilasto. Tasaisessa jakautumisessa on yksi tila. Diskreetin todennäköisyysjakauman moodi on piste, jossa todennäköisyysmassafunktio saavuttaa korkeimman pisteensä. Yllä olevien tulkintojen perusteella voidaan sanoa, että globaalit maksimit ovat moodeja.

Harkitse kaikkien kolmen toimenpiteen soveltamista seuraavaan tietosarjaan.

TIEDOT: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}

Keskiarvo=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12

Mediaani=9 (13. elementti)

Tila=9 (9:n esiintymistiheys=5)

Mitä eroa on keskiarvon, mediaanin ja tilan välillä?

• Aritmeettinen keskiarvo on arvojen (havaintojen) summa jaettuna havaintojen määrällä. Se ei ole vankka tilasto, ja se on voimakkaasti riippuvainen tarkasteltavan jakauman normaalijakauman luonteesta. Yksittäinen poikkeava arvo voi aiheuttaa merkittävän muutoksen keskiarvossa ja antaa suhteellisen harhaanjohtavia arvoja. Käsite voidaan laajentaa geometriseen keskiarvoon, harmoniseen keskiarvoon, painotettuun keskiarvoon ja niin edelleen.

• Mediaani on havaintojoukon keskiarvot, ja poikkeamat vaikuttavat siihen suhteellisesti vähemmän. Se voi antaa hyvän arvion yhteenvetotilastoksi erittäin vääristyneissä tapauksissa.

• Tila on yleisimmät havaintoarvot tietojoukossa. Jos jakauma on positiivinen vino, moodi on vasemmalle mediaaniin ja, jos negatiivisesti vinoutunut, tila on oikealle mediaaniin.

• Jos positiivisesti vinossa, keskiarvo on oikea mediaaniin nähden; jos negatiivisesti vino keskiarvo on mediaanin vasemmalla puolella.

• Normaalijakaumassa kaikki kolme, keskiarvo, tila ja mediaani ovat yhtä suuret.

Suositeltava: