Ohjattu, ohjaamaton ja vahvistava oppiminen ovat kolme erillistä lähestymistapaa koneoppimisen alalla. Jokainen lähestymistapa käyttää erilaisia tekniikoita ja algoritmeja erityyppisten ongelmien ratkaisemiseksi ja tiettyjen tavoitteiden saavuttamiseksi. Tutkitaan näiden lähestymistapojen eroja ja annetaan kattava selitys niiden ominaisuuksista ja sovelluksista.
Valvottu oppiminen on koneoppimisen tyyppi, jossa algoritmi oppii merkityistä tiedoista. Merkitty data koostuu syöttöesimerkeistä, jotka on yhdistetty niitä vastaaviin oikeaan lähtö- tai tavoitearvoon. Ohjatun oppimisen tavoitteena on kouluttaa malli, joka voi ennustaa tarkasti tulosten uusille, näkymättömille tuloille. Oppimisalgoritmi käyttää merkittyjä tietoja päätelläkseen kuvioita ja suhteita syöttöominaisuuksien ja tulosten tunnisteiden välillä. Sitten se yleistää tämän tiedon tehdäkseen ennusteita uudesta, merkitsemättömästä tiedosta. Ohjattua oppimista käytetään yleisesti tehtävissä, kuten luokittelu ja regressio.
Esimerkiksi luokitusongelmassa algoritmi opetetaan tietojoukolle, jossa jokainen datapiste on merkitty tietyllä luokalla. Algoritmi oppii luokittelemaan uusia, näkymättömiä datapisteitä johonkin ennalta määritellyistä luokista merkityistä esimerkeistä oppimiensa mallien perusteella. Regressiotehtävässä algoritmi oppii ennustamaan jatkuvan numeerisen arvon syöteominaisuuksien perusteella.
Sen sijaan ohjaamaton oppiminen käsittelee merkitsemätöntä dataa. Ohjaamattoman oppimisen tavoitteena on löytää piilotettuja malleja, rakenteita tai suhteita tiedoista ilman aiempaa tietoa tulosten tunnisteista. Toisin kuin ohjatussa oppimisessa, ohjaamattomilla oppimisalgoritmeilla ei ole erityisiä tavoitearvoja, jotka ohjaisivat oppimisprosessia. Sen sijaan he keskittyvät löytämään tiedosta merkityksellisiä esityksiä tai klustereita. Ohjaamatonta oppimista käytetään yleisesti tehtävissä, kuten klusteroinnissa, ulottuvuuksien vähentämisessä ja poikkeamien havaitsemisessa.
Klusterointi on suosittu ohjaamattoman oppimisen sovellus, jossa algoritmi ryhmittelee samanlaiset datapisteet yhteen niiden luontaisten ominaisuuksien perusteella. Esimerkiksi asiakassegmentoinnissa voidaan käyttää valvomatonta oppimisalgoritmia tunnistamaan erilliset asiakasryhmät heidän ostokäyttäytymisensä tai demografisten tietojen perusteella.
Vahvistusoppiminen on erilainen paradigma, jossa agentti oppii olemaan vuorovaikutuksessa ympäristön kanssa maksimoidakseen kumulatiivisen palkkiosignaalin. Vahvistusoppimisessa algoritmi oppii yritys ja erehdys -prosessin kautta toimimalla, tarkkailemalla ympäristön tilaa ja saamalla palautetta palkkioiden tai rangaistusten muodossa. Tavoitteena on löytää optimaalinen politiikka tai toimenpidekokonaisuus, joka maksimoi pitkän aikavälin palkkion. Vahvistusoppimista käytetään yleisesti sellaisissa tehtävissä kuin pelaaminen, robotiikka ja autonomiset järjestelmät.
Esimerkiksi shakkipelissä vahvistusoppimisagentti voi oppia pelaamaan tutkimalla erilaisia liikkeitä, vastaanottamalla palkintoja tai rangaistuksia kunkin liikkeen tuloksen perusteella ja säätämällä strategiaansa maksimoimaan voittomahdollisuudet.
Ohjattu oppiminen käyttää merkittyä dataa mallin kouluttamiseen ennustetehtäviin, ohjaamaton oppiminen löytää kuvioita ja rakenteita merkitsemättömästä tiedosta ja vahvistusoppiminen oppii vuorovaikutuksessa ympäristön kanssa maksimoidakseen palkkiosignaalin. Jokaisella lähestymistavalla on omat vahvuutensa ja heikkoutensa, ja se sopii erilaisiin ongelmiin ja sovelluksiin.
Muita viimeaikaisia kysymyksiä ja vastauksia liittyen EITC/AI/GCML Google Cloud Machine Learning:
- Mikä on teksti puheeksi (TTS) ja miten se toimii tekoälyn kanssa?
- Mitä rajoituksia suurten tietojoukkojen kanssa työskentelyssä on koneoppimisessa?
- Voiko koneoppiminen auttaa dialogia?
- Mikä on TensorFlow-leikkipaikka?
- Mitä suurempi tietojoukko oikeastaan tarkoittaa?
- Mitkä ovat esimerkkejä algoritmin hyperparametreistä?
- Mitä on ansamble-oppiminen?
- Entä jos valittu koneoppimisalgoritmi ei sovi ja miten voidaan varmistaa, että valitaan oikea?
- Tarvitseeko koneoppimismalli valvontaa koulutuksensa aikana?
- Mitä avainparametreja käytetään neuroverkkopohjaisissa algoritmeissa?
Katso lisää kysymyksiä ja vastauksia EITC/AI/GCML Google Cloud Machine Learningissä