Assosiaatio vs korrelaatio
Assosiaatio ja korrelaatio ovat kaksi tapaa selittää kahden tilastomuuttujan välistä suhdetta. Assosiaatio viittaa yleisempään termiin ja korrelaatiota voidaan pitää assosioinnin erikoistapauksena, jossa muuttujien välinen suhde on luonteeltaan lineaarinen.
Mikä yhdistys on?
Tilastollinen termi assosiaatio määritellään kahden satunnaismuuttujan väliseksi suhteeksi, mikä tekee niistä tilastollisesti riippuvaisia. Se viittaa pikemminkin yleiseen suhteeseen, jossa ei mainita suhteen erityispiirteitä, eikä sen tarvitse olla syy-suhde.
Kahden muuttujan välisen yhteyden määrittämiseen käytetään monia tilastollisia menetelmiä. Pearsonin korrelaatiokerroin, todennäköisyyssuhde, etäisyyskorrelaatio, Goodmanin ja Kruskalin lambda ja Spearmanin rho (ρ) ovat muutamia esimerkkejä.
Mikä on korrelaatio?
Korrelaatio on kahden muuttujan välisen suhteen vahvuuden mitta. Korrelaatiokerroin kvantifioi yhden muuttujan muutosasteen toisen muuttujan muutoksen perusteella. Tilastoissa korrelaatio liittyy riippuvuuden käsitteeseen, joka on kahden muuttujan välinen tilastollinen suhde
Pearsonin korrelaatiokerroin tai vain korrelaatiokerroin r on arvo välillä -1 ja 1 (-1≤r≤+1). Se on yleisimmin käytetty korrelaatiokerroin ja pätee vain muuttujien väliseen lineaariseen suhteeseen. Jos r=0, suhdetta ei ole, ja jos r≥0, suhde on suoraan verrannollinen; yhden muuttujan arvo kasvaa toisen kasvaessa. Jos r≤0, suhde on kääntäen verrannollinen; yksi muuttuja pienenee toisen kasvaessa.
Lineaarisuusehdon vuoksi korrelaatiokerrointa r voidaan käyttää myös lineaarisen suhteen olemassaolon toteamiseen muuttujien välillä.
Spearmanin rankkorrelaatiokerroin ja Kendrallin rankkorrelaatiokerroin mittaavat suhteen vahvuutta, lineaarista tekijää lukuun ottamatta. He ajattelevat, missä määrin yksi muuttuja kasvaa tai vähenee toisen kanssa. Jos molemmat muuttujat kasvavat yhdessä, kerroin tulee olemaan positiivinen ja jos toinen muuttuja kasvaa ja toinen pienenee, kertoimen arvo on negatiivinen.
Luokkorrelaatiokertoimia käytetään vain määrittämään suhteen tyyppi, mutta ei tutkimaan yksityiskohtaisesti, kuten Pearsonin korrelaatiokerrointa. Niitä käytetään myös vähentämään laskelmia ja tekemään tuloksista riippumattomampia tarkasteltujen jakaumien epänormaalisuudesta.
Mitä eroa on assosiaatiolla ja korrelaatiolla?
• Assosiaatio viittaa kahden satunnaismuuttujan väliseen yleiseen suhteeseen, kun taas korrelaatio viittaa enemmän tai vähemmän lineaariseen suhteeseen satunnaismuuttujien välillä.
• Assosiaatio on käsite, mutta korrelaatio on assosioinnin mitta, ja matemaattisia työkaluja tarjotaan korrelaation suuruuden mittaamiseen.
• Pearsonin tulomomenttikorrelaatiokerroin määrittää lineaarisen suhteen olemassaolon ja määrittää suhteen luonteen (ovatko ne verrannollisia vai käänteisesti verrannollisia).
• Rankkorrelaatiokertoimia käytetään määrittämään vain suhteen luonne, pois lukien suhteen lineaarisuus (se voi olla tai ei ole lineaarinen, mutta se kertoo, kasvavatko muuttujat yhdessä, pienenevätkö yhdessä vai yksi kasvaa kun taas toinen pienenee tai päinvastoin).