Ohjattu ja ohjaamaton oppiminen ovat kaksi koneoppimisparadigman perustyyppiä, jotka palvelevat erillisiä tarkoituksia datan luonteen ja käsiteltävän tehtävän tavoitteiden perusteella. Tehokkaiden koneoppimismallien suunnittelussa on ratkaisevan tärkeää ymmärtää, milloin ohjattua koulutusta tulee käyttää ohjaamattomana. Valinta näiden kahden lähestymistavan välillä riippuu merkittyjen tietojen saatavuudesta, halutusta tuloksesta ja tietojoukon taustalla olevasta rakenteesta.
Valvottu oppiminen on koneoppimisen tyyppi, jossa mallia opetetaan tunnistetulla tietojoukolla. Ohjatussa oppimisessa algoritmi oppii yhdistämään syötetiedot oikeaan lähtöön esittämällä opetusesimerkkejä. Nämä koulutusesimerkit koostuvat tulo-lähtö-pareista, joissa syöttötietoihin liittyy vastaava oikea lähtö- tai tavoitearvo. Ohjatun oppimisen tavoitteena on oppia kartoitusfunktio syötemuuttujista lähtömuuttujiin, joita voidaan sitten käyttää ennakoimaan näkymätöntä dataa.
Ohjattua oppimista käytetään tyypillisesti silloin, kun haluttu tulos on tiedossa ja tavoitteena on oppia tulo- ja lähtömuuttujien välinen suhde. Sitä käytetään yleisesti tehtävissä, kuten luokittelussa, jossa tavoitteena on ennustaa uusien esiintymien luokkatunnisteet, ja regressiossa, jossa tavoitteena on ennustaa jatkuva arvo. Esimerkiksi valvotussa oppimisskenaariossa voit opettaa mallin ennustamaan, onko sähköposti roskapostia vai ei, sähköpostin sisällön ja aikaisempien sähköpostien roskaposti-/ei-roskaposti-tilan perusteella.
Toisaalta ohjaamaton oppiminen on eräänlainen koneoppiminen, jossa mallia opetetaan merkitsemättömälle tietojoukolle. Valvomattomassa oppimisessa algoritmi oppii kuvioita ja rakenteita syöttötiedoista ilman nimenomaista palautetta oikeasta lähdöstä. Ohjaamattoman oppimisen tavoitteena on tutkia datan taustalla olevaa rakennetta, löytää piilotettuja malleja ja saada merkityksellisiä oivalluksia ilman merkittyä dataa.
Ohjaamatonta oppimista käytetään yleisesti, kun tavoitteena on tutkia dataa, löytää piilotettuja malleja ja ryhmitellä samanlaisia datapisteitä yhteen. Sitä käytetään usein tehtävissä, kuten klusteroinnissa, joissa tavoitteena on ryhmitellä samankaltaiset tietopisteet klustereihin niiden ominaisuuksien perusteella, ja ulottuvuuden vähentämisessä, jossa tavoitteena on vähentää ominaisuuksien määrää säilyttäen samalla tiedossa oleva olennainen tieto. Esimerkiksi valvomattomassa oppimisskenaariossa voit käyttää klusterointia asiakkaiden ryhmittelyyn heidän ostokäyttäytymisensä perusteella ilman aiempaa tietoa asiakassegmenteistä.
Valinta ohjatun ja ohjaamattoman oppimisen välillä riippuu useista tekijöistä. Jos sinulla on merkitty tietojoukko ja haluat ennustaa tiettyjä tuloksia, ohjattu oppiminen on oikea valinta. Toisaalta, jos sinulla on nimeämätön tietojoukko ja haluat tutkia tietorakennetta tai löytää piilotettuja malleja, ohjaamaton oppiminen on sopivampaa. Joissakin tapauksissa sekä ohjattujen että ohjaamattomien tekniikoiden yhdistelmää, joka tunnetaan nimellä puoliohjattu oppiminen, voidaan käyttää molempien lähestymistapojen etujen hyödyntämiseen.
Päätös käyttää ohjattua koulutusta verrattuna ohjaamattomaan koulutukseen koneoppimisessa riippuu merkittyjen tietojen saatavuudesta, tehtävän luonteesta ja halutusta tuloksesta. Valvotun ja ohjaamattoman oppimisen erojen ymmärtäminen on välttämätöntä tehokkaiden koneoppimismallien suunnittelussa, jotka voivat poimia merkityksellisiä oivalluksia ja tehdä tarkkoja ennusteita tiedosta.
Muita viimeaikaisia kysymyksiä ja vastauksia liittyen EITC/AI/GCML Google Cloud Machine Learning:
- Mikä on teksti puheeksi (TTS) ja miten se toimii tekoälyn kanssa?
- Mitä rajoituksia suurten tietojoukkojen kanssa työskentelyssä on koneoppimisessa?
- Voiko koneoppiminen auttaa dialogia?
- Mikä on TensorFlow-leikkipaikka?
- Mitä suurempi tietojoukko oikeastaan tarkoittaa?
- Mitkä ovat esimerkkejä algoritmin hyperparametreistä?
- Mitä on ansamble-oppiminen?
- Entä jos valittu koneoppimisalgoritmi ei sovi ja miten voidaan varmistaa, että valitaan oikea?
- Tarvitseeko koneoppimismalli valvontaa koulutuksensa aikana?
- Mitä avainparametreja käytetään neuroverkkopohjaisissa algoritmeissa?
Katso lisää kysymyksiä ja vastauksia EITC/AI/GCML Google Cloud Machine Learningissä