Kategoriset tiedot vs numeeriset tiedot
Tiedot ovat tosiasioita tai tietoja, jotka on kerätty viittausta tai analysointia varten. Usein nämä tiedot kerätään asianomaisen kohteen attribuuttina. Tämä attribuutti voi vaihdella toisistaan, joten tätä vaihtelevaa attribuuttia voidaan pitää muuttujana. Muuttujat voivat ottaa eri muotoja arvoja, ja nämä ovat olennaisia kerätylle tiedolle.
Muuttujat voivat olla joko kvalitatiivisia tai määrällisiä; eli jos muuttuja on kvantitatiivinen, vastaukset ovat numeroita ja mitatun attribuutin suuruus voidaan ilmoittaa tietyllä tarkkuudella. Toinen tyyppi, kvalitatiiviset muuttujat mittaavat laadullisia attribuutteja, ja muuttujien olettamia arvoja ei voida antaa koon tai suuruuden suhteen. Muuttujat itsessään tunnetaan kategorisina muuttujina ja kategorisen muuttujan avulla kerätyt tiedot ovat kategorisia tietoja.
Lisätietoja numeerisista tiedoista
Numeeriset tiedot ovat periaatteessa muuttujasta saatuja kvantitatiivisia tietoja, ja arvolla on koon/suuruuden tunne. Saatu numeerinen data jaetaan edelleen kolmeen luokkaan Stanley Smith Stevensin kehittämän teorian perusteella. Numeerinen data voi olla joko järjestyslukua, väliä tai suhdetta. Tietojen tyyppi määräytyy arvojen mittausmenetelmän mukaan, ja tyypit tunnetaan mittaustasoina.
Ihmisen paino, kahden pisteen etäisyys, lämpötila ja osakkeen hinta ovat esimerkkejä numeerisista tiedoista.
Tilastossa suurin osa menetelmistä on johdettu numeeristen tietojen analysointiin. Peruskuvaustilastoja ja regressiota sekä muita päättelymenetelmiä käytetään pääasiassa numeerisen datan analysointiin.
Lisätietoja kategorisista tiedoista
Kategoriset tiedot ovat kvalitatiivisen muuttujan, usein numeron, sanan tai symbolin, arvoja. Ne tuovat esiin sen tosiasian, että muuttuja kyseisessä tapauksessa kuuluu johonkin useista käytettävissä olevista vaihtoehdoista. Siksi ne kuuluvat johonkin luokkaan; tästä syystä nimi kategorinen.
Henkilön poliittinen suuntautuminen, henkilön kansallisuus, henkilön lempiväri ja potilaan veriryhmä ovat laadullisia ominaisuuksia. Joskus luku voidaan saada kategorisena arvona, mutta itse luku ei edusta mitatun attribuutin suuruutta. Postinumero on yksi esimerkki.
Lisäksi kaikki kategoriset arvot kuuluvat nimelliseen tietotyyppiin, joka on toinen tyyppi, joka perustuu mittaustasoihin. Kategorisen tiedon analysoinnissa käytetyt menetelmät eroavat numeerisen datan analyysimenetelmistä, mutta taustalla voi olla sama periaate.
Mitä eroa on kategorisilla ja numeerisilla tiedoilla?
• Numeeriset tiedot ovat kvantitatiiviselle muuttujalle saatuja arvoja, ja niillä on muuttujan kontekstiin liittyvä suuruus (täten ne ovat aina numeroita tai symboleja, joissa on numeerinen arvo). Kategoriset tiedot ovat kvalitatiiviselle muuttujalle saatuja arvoja; kategorisilla datanumeroilla ei ole suuruuden tunnetta.
• Numeeriset tiedot kuuluvat aina joko järjestys-, suhde- tai välityyppiin, kun taas kategoriset tiedot kuuluvat nimellistyyppiin.
• Kvantitatiivisen tiedon analysoinnissa käytetyt menetelmät eroavat kategorisille tiedoille käytetyistä menetelmistä, vaikka periaatteet ovat samat, ainakin sovelluksessa on merkittäviä eroja.
• Numeerisia tietoja analysoidaan tilastollisilla menetelmillä kuvailevissa tilastoissa, regressiossa, aikasarjoissa ja monessa muussa.
• Kategoriselle datalle käytetään yleensä kuvailevia menetelmiä ja graafisia menetelmiä. Myös joitain ei-parametrisiä testejä käytetään.