Avainero – valvottu vs. valvomaton koneoppiminen
Valvottu oppiminen ja ohjaamaton oppiminen ovat kaksi koneoppimisen ydinkäsitettä. Valvottu oppiminen on koneoppimisen tehtävä, jossa opetetaan funktio, joka kartoittaa syötteen lähtöön esimerkkitulo-syöte-parien perusteella. Valvomaton oppiminen on koneoppimisen tehtävä päätellä funktio, joka kuvaa piilotettua rakennetta merkitsemättömästä tiedosta. Tärkein ero ohjatun ja valvomattoman koneoppimisen välillä on se, että ohjattu oppiminen käyttää merkittyä dataa, kun taas valvomaton oppiminen käyttää merkitsemätöntä dataa.
Machine Learning on tietojenkäsittelytieteen ala, joka antaa tietokonejärjestelmälle mahdollisuuden oppia tiedoista ilman, että sitä on erikseen ohjelmoitu. Sen avulla voidaan analysoida dataa ja ennustaa siinä olevia malleja. Koneoppimiseen on monia sovelluksia. Jotkut niistä ovat kasvojentunnistus, eleiden tunnistus ja puheentunnistus. Koneoppimiseen liittyy erilaisia algoritmeja. Jotkut niistä ovat regressio, luokittelu ja klusterointi. Yleisimmät ohjelmointikielet koneoppimiseen perustuvien sovellusten kehittämiseen ovat R ja Python. Myös muita kieliä, kuten Java, C++ ja Matlab, voidaan käyttää.
Mitä on ohjattu oppiminen?
Koneoppimiseen perustuvissa järjestelmissä malli toimii algoritmin mukaan. Ohjatussa oppimisessa mallia ohjataan. Ensinnäkin malli on koulutettava. Saatujen tietojen avulla se voi ennustaa vastauksia tulevia tapauksia varten. Malli on koulutettu käyttämällä merkittyä tietojoukkoa. Kun järjestelmälle annetaan näytetietoja, se voi ennustaa tuloksen. Seuraavassa on pieni ote suositusta IRIS-tietojoukosta.
Yllä olevan taulukon mukaan attribuutteiksi kutsutaan verholehden pituutta, verholehden leveyttä, patellin pituutta, leveyttä ja lajia. Sarakkeet tunnetaan ominaisuuksina. Yhdellä rivillä on tiedot kaikista määritteistä. Siksi yhtä riviä kutsutaan havainnon. Tiedot voivat olla joko numeerisia tai kategorisia. Malliin annetaan havainnot syötteenä vastaavan lajin nimi. Kun uusi havainto annetaan, mallin tulee ennustaa lajityyppi, johon se kuuluu.
Valvotussa oppimisessa on algoritmeja luokittelua ja regressiota varten. Luokittelu on merkittyjen tietojen luokitteluprosessi. Malli loi rajat, jotka erottivat tietoluokat. Kun malliin tarjotaan uutta tietoa, se voi luokitella pisteen sijainnin perusteella. K-Lähimmät naapurit (KNN) on luokitusmalli. K-arvosta riippuen luokka päätetään. Esimerkiksi kun k on 5, jos tietty datapiste on lähellä kahdeksaa datapistettä luokassa A ja kuutta datapistettä luokassa B, datapiste luokitellaan A:ksi.
Regressio on prosessi, jossa ennakoidaan aiempien tietojen trendi, jotta voidaan ennustaa uusien tietojen tulos. Regressiossa tulos voi koostua yhdestä tai useammasta jatkuvasta muuttujasta. Ennustus tehdään käyttämällä viivaa, joka kattaa useimmat tietopisteet. Yksinkertaisin regressiomalli on lineaarinen regressio. Se on nopea eikä vaadi viritysparametreja, kuten KNN:ssä. Jos tiedoissa näkyy parabolinen trendi, lineaarinen regressiomalli ei sovellu.
Nämä ovat esimerkkejä valvotuista oppimisalgoritmeista. Yleensä ohjatuilla oppimismenetelmillä saadut tulokset ovat tarkempia ja luotettavampia, koska syöttödata on hyvin tunnettu ja merkitty. Siksi koneen on analysoitava vain piilotetut kuviot.
Mitä on ohjaamaton oppiminen?
Ohjaamattomassa oppimisessa mallia ei valvota. Malli toimii itsenäisesti ennustaakseen tuloksia. Se käyttää koneoppimisalgoritmeja tehdäkseen johtopäätöksiä merkitsemättömästä tiedosta. Yleensä valvomattomat oppimisalgoritmit ovat vaikeampia kuin valvotut oppimisalgoritmit, koska tietoa on vähän. Klusteroiminen on eräänlaista ohjaamatonta oppimista. Sitä voidaan käyttää ryhmittelemään tuntematonta dataa algoritmien avulla. K-keskiarvo ja tiheyteen perustuva klusterointi ovat kaksi klusterointialgoritmia.
k-keskiarvoalgoritmi, sijoittaa k keskipisteen satunnaisesti jokaiselle klusterille. Sitten jokainen datapiste määrätään lähimpään sentroidiin. Euklidisen etäisyyden avulla lasketaan etäisyys datapisteestä sentroidiin. Datapisteet on luokiteltu ryhmiin. K sentroidin sijainnit lasketaan uudelleen. Uusi keskipisteen sijainti määräytyy ryhmän kaikkien pisteiden keskiarvon perusteella. Jälleen jokainen datapiste on osoitettu lähimpään sentroidiin. Tämä prosessi toistuu, kunnes sentroidit eivät enää muutu. k-mean on nopea klusterointialgoritmi, mutta klusterointipisteiden alustusta ei ole määritelty. Lisäksi on olemassa suuri vaihtelu klusterointimalleissa, jotka perustuvat klusteripisteiden alustukseen.
Toinen klusterointialgoritmi on tiheyteen perustuva klusterointi. Se tunnetaan myös nimellä Density Based Spatial Clustering Applications with noise. Se toimii määrittelemällä klusterin tiheydellä yhdistettyjen pisteiden enimmäisjoukoksi. Ne ovat kaksi parametria, joita käytetään tiheyteen perustuvaan klusterointiin. Ne ovat Ɛ (epsilon) ja minimipisteet. Ɛ on alueen suurin säde. Vähimmäispisteet ovat pisteiden vähimmäismäärä Ɛ-naapurustossa klusterin määrittelemiseksi. Nämä ovat esimerkkejä klusteroinnista, joka kuuluu ohjaamattomaan oppimiseen.
Yleensä valvomattomista oppimisalgoritmeista saadut tulokset eivät ole kovin tarkkoja ja luotettavia, koska koneen on määriteltävä ja nimettävä syöttötiedot ennen piilokuvioiden ja toimintojen määrittämistä.
Mikä on samank altaisuus ohjatun ja valvomattoman koneoppimisen välillä?
Sekä ohjattu että ohjaamaton oppiminen ovat koneoppimisen tyyppejä
Mitä eroa on valvotulla ja valvomattomalla koneoppimisella?
Valvottu vs. valvomaton koneoppiminen |
|
Supervised Learning on koneoppimisen tehtävä, jossa opetetaan funktio, joka kartoittaa syötteen lähtöön esimerkkitulo-syöte-parien perusteella. | Valvomaton oppiminen on koneoppimisen tehtävä päätellä funktio, joka kuvaa piilotettua rakennetta merkitsemättömästä tiedosta. |
Päätoiminnot | |
Valvotussa oppimisessa malli ennustaa tuloksen merkittyjen syöttötietojen perusteella. | Valvomattomassa oppimisessa malli ennustaa tuloksen ilman merkittyä dataa tunnistamalla kuviot itsestään. |
Tuloksen tarkkuus | |
Valvotuilla oppimismenetelmillä saadut tulokset ovat tarkempia ja luotettavampia. | Valvomattomilla oppimismenetelmillä saadut tulokset eivät ole kovin tarkkoja ja luotettavia. |
Pääalgoritmit | |
Valvotussa oppimisessa on regressio- ja luokittelualgoritmeja. | On olemassa algoritmeja klusterointiin valvomattomassa oppimisessa. |
Yhteenveto – Valvottu vs. valvomaton koneoppiminen
Valvottu oppiminen ja ohjaamaton oppiminen ovat kaksi koneoppimisen tyyppiä. Valvottu oppiminen on koneoppimisen tehtävä, jossa opetetaan funktio, joka kartoittaa syötteen lähtöön esimerkkitulo-syöte-parien perusteella. Valvomaton oppiminen on koneoppimisen tehtävä päätellä funktio, joka kuvaa piilotettua rakennetta merkitsemättömästä tiedosta. Ero ohjatun ja valvomattoman koneoppimisen välillä on se, että ohjattu oppiminen käyttää merkittyä dataa, kun taas valvomaton oppiminen käyttää merkitsemätöntä dataa.