Positiivinen korrelaatio vs negatiivinen korrelaatio
Korrelaatio on kahden muuttujan välisen suhteen vahvuuden mitta. Korrelaatiokerroin kvantifioi yhden muuttujan muutosasteen toisen muuttujan muutoksen perusteella. Tilastoissa korrelaatio liittyy riippuvuuden käsitteeseen, joka on kahden muuttujan välinen tilastollinen suhde.
Pearsonin korrelaatiokerroin tai Pearsonin tuote-momenttikorrelaatiokerroin tai yksinkertaisesti korrelaatiokerroin saadaan seuraavilla kaavoilla.
Väestölle:
Esimerkki:
ja seuraava lauseke vastaa yllä olevaa lauseketta.
ja
ovat vakiopisteitä X ja Y.
on keskiarvo ja sX ja sY ovat X:n ja Y:n keskihajontoja.
Pearsonin korrelaatiokerroin (tai vain korrelaatiokerroin) on yleisimmin käytetty korrelaatiokerroin ja pätee vain muuttujien väliseen lineaariseen suhteeseen. r on arvo välillä -1 ja 1 (-1 ≤ r ≤ +1). Jos r=0, suhdetta ei ole ja jos r ≥ 0, suhde on suoraan verrannollinen ja yhden muuttujan arvo kasvaa toisen kanssa. Jos r ≤ 0, yksi muuttuja pienenee toisen kasvaessa ja päinvastoin.
Lineaarisuusehdon vuoksi korrelaatiokerrointa r voidaan käyttää myös lineaarisen suhteen olemassaolon toteamiseen muuttujien välillä.
Mitä eroa on positiivisella ja negatiivisella korrelaatiolla?
• Kun kahden satunnaismuuttujan välillä on positiivinen korrelaatio (r > 0), yksi muuttuja liikkuu verrannollisesti toiseen muuttujaan. Jos yksi muuttuja kasvaa, toinen kasvaa. Jos yksi muuttuja pienenee, myös toinen pienenee.
• Kun kahden satunnaismuuttujan välillä on negatiivinen korrelaatio (r < 0), muuttujat liikkuvat toisiaan vastakkain. Jos yksi muuttuja kasvaa, toinen pienenee ja päinvastoin.
• Positiivista korrelaatiota approksimoivalla viivalla on positiivinen gradientti ja suoralla, joka approksimoi negatiivinen korrelaatio, on negatiivinen gradientti.