Regressio vs korrelaatio
Tilastossa kahden satunnaismuuttujan välisen suhteen määrittäminen on tärkeää. Se antaa mahdollisuuden tehdä ennusteita yhdestä muuttujasta suhteessa muihin. Regressioanalyysiä ja korrelaatiota sovelletaan sääennusteisiin, rahoitusmarkkinoiden käyttäytymiseen, fyysisten suhteiden luomiseen kokein ja paljon todellisemmissa skenaarioissa.
Mitä on regressio?
Regressio on tilastollinen menetelmä, jota käytetään kahden muuttujan välisen suhteen piirtämiseen. Usein tietoja kerättäessä saattaa olla muuttujia, jotka ovat riippuvaisia muista. Tarkka suhde näiden muuttujien välillä voidaan määrittää vain regressiomenetelmillä. Tämän suhteen määrittäminen auttaa ymmärtämään ja ennustamaan yhden muuttujan käyttäytymistä toiseen kohtaan.
Regressioanalyysin yleisin sovellus on riippumattoman muuttujan arvon estimoiminen riippumattomien muuttujien tietylle arvolle tai arvoalueelle. Esimerkiksi regression avulla voimme määrittää hyödykkeen hinnan ja kulutuksen välisen suhteen satunnaisotoksesta kerättyjen tietojen perusteella. Regressioanalyysi tuottaa tietojoukon regressiofunktion, joka on matemaattinen malli, joka sopii parhaiten käytettävissä olevaan dataan. Tämä voidaan helposti esittää sirontakaaviolla. Graafisesti regressio vastaa parhaiten sopivan käyrän löytämistä annetulle tietojoukolle. Käyrän funktio on regressiofunktio. Matemaattisen mallin avulla voidaan ennustaa hyödykkeen kysyntä tietyllä hinnalla.
Siksi regressioanalyysiä käytetään laaj alti ennustamisessa ja ennustamisessa. Sitä käytetään myös suhteiden luomiseen kokeellisissa tiedoissa, fysiikan, kemian ja monien luonnontieteiden ja tekniikan aloilla. Jos suhde tai regressiofunktio on lineaarinen funktio, prosessi tunnetaan lineaarisena regressiona. Sirontakaaviossa se voidaan esittää suorana. Jos funktio ei ole lineaarinen parametrien yhdistelmä, regressio on epälineaarinen.
Mikä on korrelaatio?
Korrelaatio on kahden muuttujan välisen suhteen vahvuuden mitta. Korrelaatiokerroin kvantifioi yhden muuttujan muutosasteen toisen muuttujan muutoksen perusteella. Tilastoissa korrelaatio liittyy riippuvuuden käsitteeseen, joka on kahden muuttujan välinen tilastollinen suhde.
Pearsonsin korrelaatiokerroin tai vain korrelaatiokerroin r on arvo välillä -1 ja 1 (-1≤r≤+1). Se on yleisimmin käytetty korrelaatiokerroin ja pätee vain muuttujien väliseen lineaariseen suhteeseen. Jos r=0, suhdetta ei ole, ja jos r≥0, suhde on suoraan verrannollinen; eli yhden muuttujan arvo kasvaa toisen kasvaessa. Jos r≤0, suhde on kääntäen verrannollinen; eli yksi muuttuja pienenee toisen kasvaessa.
Lineaarisuusehdon vuoksi korrelaatiokerrointa r voidaan käyttää myös lineaarisen suhteen olemassaolon toteamiseen muuttujien välillä.
Mitä eroa on regressiolla ja korrelaatiolla?
Regressio antaa kahden satunnaismuuttujan välisen suhteen muodon, ja korrelaatio antaa suhteen vahvuuden.
Regressioanalyysi tuottaa regressiofunktion, joka auttaa ekstrapoloimaan ja ennustamaan tuloksia, kun taas korrelaatio voi antaa vain tietoa siitä, mihin suuntaan se voi muuttua.
Analyysin avulla saadaan tarkemmat lineaariset regressiomallit, jos korrelaatiokerroin on suurempi. (|r|≥0,8)