Avainero luokituksen ja regressiopuun välillä on se, että luokituksessa riippuvat muuttujat ovat kategorisia ja järjestämättömiä, kun taas regressiossa riippuvat muuttujat ovat jatkuvia tai järjestettyjä kokonaisia arvoja.
Luokittelu ja regressio ovat oppimistekniikoita, joilla luodaan ennustemalleja kerätyistä tiedoista. Molemmat tekniikat esitetään graafisesti luokitus- ja regressiopuina, tai pikemminkin vuokaavioina, joissa on datajaot jokaisen vaiheen jälkeen, tai pikemminkin "haarana" puussa. Tätä prosessia kutsutaan rekursiiviseksi osioksi. Alat, kuten Mining, käyttävät näitä luokittelu- ja regressiooppimistekniikoita. Tämä artikkeli keskittyy luokituspuuhun ja regressiopuuhun.
Mikä on luokitus?
Luokittelu on tekniikka, jota käytetään kaavion luomiseen, joka näyttää tietojen järjestämisen alkaen edeltäjämuuttujasta. Riippuvat muuttujat luokittelevat tiedot.
Kuva 01: Tiedonlouhinta
Luokituspuu alkaa riippumattomalla muuttujalla, joka haarautuu kahteen ryhmään olemassa olevien riippuvien muuttujien määrittämänä. Sen on tarkoitus selventää vasteita riippuvien muuttujien tuottaman luokittelun muodossa.
Mikä on regressio
Regressio on ennustemenetelmä, joka perustuu oletettuun tai tunnettuun numeeriseen lähtöarvoon. Tämä lähtöarvo on tulos sarjasta rekursiivista osiointia, jossa jokaisella askeleella on yksi numeerinen arvo ja toinen ryhmä riippuvaisia muuttujia, jotka haarautuvat toiseksi pariksi, kuten tämä.
Regressiopuu alkaa yhdellä tai useammalla esiastemuuttujalla ja päättyy yhteen lopulliseen tulosmuuttujaan. Riippuvat muuttujat ovat joko jatkuvia tai diskreettejä numeerisia muuttujia.
Mitä eroa luokittelulla ja regressiolla on?
Luokittelu vs regressio |
|
Puumalli, jossa kohdemuuttuja voi ottaa erillisen joukon arvoja. | Puumalli, jossa kohdemuuttuja voi ottaa jatkuvia arvoja, tyypillisesti reaalilukuja. |
Riippuvainen muuttuja | |
Luokittelupuussa riippuvat muuttujat ovat kategorisia. | Regressiopuun riippuvat muuttujat ovat numeerisia. |
Arvot | |
Siellä on asetettu määrä järjestämättömiä arvoja. | On joko erilliset, mutta järjestetyt arvot tai epämääräiset arvot. |
Rakentamisen tarkoitus | |
Regressiopuun rakentamisen tarkoitus on sovittaa regressiojärjestelmä jokaiseen determinanttihaaraan siten, että odotettu lähtöarvo tulee esiin. | Luokituspuu haarautuu edellisestä solmusta johdetun riippuvan muuttujan määrittämänä. |
Yhteenveto – Luokittelu vs regressio
Regressio- ja luokituspuut ovat hyödyllisiä tekniikoita kartoittaa prosessi, joka osoittaa tutkittuun tulokseen joko luokituksena tai yksittäisenä numeerisena arvona. Luokituspuun ja regressiopuun välinen ero on niiden riippuvainen muuttuja. Luokittelupuilla on riippuvaisia muuttujia, jotka ovat kategorisia ja järjestämättömiä. Regressiopuilla on riippuvia muuttujia, jotka ovat jatkuvia arvoja tai järjestettyjä kokonaisarvoja.