Koneoppimismallin koulutusprosessiin kuuluu sen altistaminen valtaville tietomäärille, jotta se voi oppia malleja ja tehdä ennusteita tai päätöksiä ilman, että sitä on erikseen ohjelmoitu kullekin skenaariolle. Koulutusvaiheen aikana koneoppimismalli käy läpi sarjan iteraatioita, joissa se säätää sisäisiä parametrejaan minimoimaan virheet ja parantamaan suorituskykyään tietyssä tehtävässä.
Valvonta koulutuksen aikana tarkoittaa ihmisen toiminnan tasoa, joka tarvitaan ohjaamaan mallin oppimisprosessia. Valvonnan tarve voi vaihdella riippuen käytetyn koneoppimisalgoritmin tyypistä, tehtävän monimutkaisuudesta ja koulutukseen tarjottavien tietojen laadusta.
Ohjatussa oppimisessa, joka on eräänlainen koneoppiminen, jossa mallia koulutetaan merkittyjen tietojen perusteella, ohjaus on välttämätöntä. Merkitty data tarkoittaa, että jokainen tulodatapiste on paritettu oikean lähdön kanssa, jolloin malli voi oppia yhdistämisen tulojen ja lähtöjen välillä. Valvotun koulutuksen aikana tarvitaan ihmisen valvontaa, jotta koulutusdatalle voidaan antaa oikeat merkinnät, arvioida mallin ennusteita ja säätää mallin parametreja palautteen perusteella.
Esimerkiksi valvotussa kuvantunnistustehtävässä, jos tavoitteena on kouluttaa malli luokittelemaan kissojen ja koirien kuvia, ihmisen ohjaajan on merkittävä jokainen kuva joko kissaksi tai koiraksi. Malli oppisi sitten näistä leimatuista esimerkeistä tehdäkseen ennusteita uusista, näkymättömistä kuvista. Esimies arvioi mallin ennusteita ja antaa palautetta sen tarkkuuden parantamiseksi.
Toisaalta valvomattomat oppimisalgoritmit eivät vaadi merkittyjä tietoja harjoitteluun. Nämä algoritmit oppivat kuvioita ja rakenteita syöttötiedoista ilman nimenomaista ohjausta. Ohjaamatonta oppimista käytetään usein esimerkiksi klusterointiin, poikkeamien havaitsemiseen ja mittasuhteiden vähentämiseen. Ohjaamattomassa oppimisessa kone voi oppia itsenäisesti ilman ihmisen valvontaa harjoituksen aikana.
Puoliohjattu oppiminen on hybridilähestymistapa, jossa yhdistyvät sekä ohjatun että ohjaamattoman oppimisen elementit. Tässä lähestymistavassa mallia koulutetaan yhdistelmällä merkittyjä ja merkitsemättömiä tietoja. Merkitty data tarjoaa jonkin verran ohjausta oppimisprosessin ohjaamiseksi, kun taas nimeämätön data antaa mallille mahdollisuuden löytää tiedosta lisämalleja ja suhteita.
Vahvistusoppiminen on toinen koneoppimisen paradigma, jossa agentti oppii tekemään peräkkäisiä päätöksiä vuorovaikutuksessa ympäristön kanssa. Vahvistusoppimisessa agentti saa palautetta toimistaan perustuvien palkkioiden tai seuraamusten muodossa. Agentti oppii maksimoimaan kumulatiivisen palkkionsa ajan mittaan yrityksen ja erehdyksen avulla. Vaikka vahvistusoppiminen ei vaadi nimenomaista ohjausta perinteisessä mielessä, ihmisen ohjausta voidaan tarvita palkitsemisrakenteen suunnittelussa, oppimistavoitteiden asettamisessa tai oppimisprosessin hienosäädössä.
Koneoppimiskoulutuksen valvonnan tarve riippuu käytetystä oppimisparadigmasta, merkittyjen tietojen saatavuudesta ja tehtävän monimutkaisuudesta. Ohjattu oppiminen edellyttää ihmisen valvontaa, jotta voidaan toimittaa merkittyjä tietoja ja arvioida mallin suorituskykyä. Ohjaamaton oppiminen ei vaadi ohjausta, sillä malli oppii itsenäisesti merkitsemättömästä tiedosta. Puoliohjattu oppiminen yhdistää sekä ohjatun että ohjaamattoman oppimisen elementtejä, kun taas vahvistusoppiminen tarkoittaa oppimista vuorovaikutuksessa ympäristön kanssa.
Muita viimeaikaisia kysymyksiä ja vastauksia liittyen EITC/AI/GCML Google Cloud Machine Learning:
- Mikä on teksti puheeksi (TTS) ja miten se toimii tekoälyn kanssa?
- Mitä rajoituksia suurten tietojoukkojen kanssa työskentelyssä on koneoppimisessa?
- Voiko koneoppiminen auttaa dialogia?
- Mikä on TensorFlow-leikkipaikka?
- Mitä suurempi tietojoukko oikeastaan tarkoittaa?
- Mitkä ovat esimerkkejä algoritmin hyperparametreistä?
- Mitä on ansamble-oppiminen?
- Entä jos valittu koneoppimisalgoritmi ei sovi ja miten voidaan varmistaa, että valitaan oikea?
- Mitä avainparametreja käytetään neuroverkkopohjaisissa algoritmeissa?
- Mikä on TensorBoard?
Katso lisää kysymyksiä ja vastauksia EITC/AI/GCML Google Cloud Machine Learningissä