Koneoppimisen ala kattaa useita menetelmiä ja paradigmoja, joista jokainen sopii erityyppisiin tietoihin ja ongelmiin. Näistä paradigmoista ohjattu ja ohjaamaton oppiminen ovat kaksi perustavanlaatuisinta.
Ohjattu oppiminen sisältää mallin harjoittamisen nimetylle tietojoukolle, jossa syöttötiedot yhdistetään oikeaan lähtöön. Malli oppii yhdistämään tulot lähtöihin minimoimalla ennusteidensa ja todellisten lähtöjen välisen virheen. Sen sijaan ohjaamaton oppiminen käsittelee nimeämätöntä dataa, jossa tavoitteena on päätellä tietopisteiden sisällä oleva luonnollinen rakenne.
On olemassa eräänlainen oppiminen, joka yhdistää sekä ohjatut että ohjaamattomat oppimistekniikat, jota usein kutsutaan puoliohjatuksi oppimiseksi. Tämä lähestymistapa hyödyntää sekä merkittyjä että merkitsemättömiä tietoja koulutusprosessin aikana. Puoliohjatun oppimisen taustalla on se, että merkitsemätön data, kun sitä käytetään yhdessä pienen määrän merkittyä dataa, voi parantaa oppimistarkkuutta huomattavasti. Tämä on erityisen hyödyllistä skenaarioissa, joissa merkittyä tietoa on vähän tai kallista saada, mutta merkitsemätöntä dataa on runsaasti ja niitä on helppo kerätä.
Puoliohjattu oppiminen perustuu oletukseen, että merkitsemättömän datan taustalla oleva rakenne voi tarjota arvokasta tietoa, joka täydentää merkittyä dataa. Tämä oletus voi esiintyä useissa muodoissa, kuten klusteriolettama, moniosaoletus tai matalatiheyksinen erotusoletus. Klusterioletus olettaa, että saman klusterin datapisteillä on todennäköisesti sama nimiö. Monipuolinen oletus viittaa siihen, että korkeadimensionaaliset tiedot ovat moniulotteisia paljon pienempiä, ja tehtävänä on oppia tämä monisto. Pienitiheyksinen erotteluoletus perustuu ajatukseen, että päätösrajan tulisi olla alhaisen datatiheyden alueella.
Yksi yleisimmistä puoliohjatussa oppimisessa käytetyistä tekniikoista on itseharjoittelu. Itsekoulutuksessa malli opetetaan aluksi merkittyjen tietojen perusteella. Sitten se käyttää omia ennusteitaan leimaamattomista tiedoista pseudotunnisteina. Mallia koulutetaan edelleen tälle lisätylle tietojoukolle, ja se tarkentaa iteratiivisesti sen ennusteita. Toinen tekniikka on yhteiskoulutus, jossa kahta tai useampaa mallia koulutetaan samanaikaisesti eri näkemyksiä datasta. Jokainen malli vastaa osan merkitsemättömästä tiedosta merkitsemisestä, jota sitten käytetään muiden mallien kouluttamiseen. Tämä menetelmä hyödyntää tietojen useiden näkymien redundanssia oppimissuorituskyvyn parantamiseksi.
Graafipohjaiset menetelmät ovat yleisiä myös puoliohjatussa oppimisessa. Nämä menetelmät muodostavat graafin, jossa solmut edustavat datapisteitä ja reunat edustavat niiden välisiä yhtäläisyyksiä. Oppimistehtävä muotoillaan sitten uudelleen graafipohjaiseksi optimointitehtäväksi, jossa tavoitteena on levittää tunnisteita nimetyistä solmuista merkitsemättömiin graafisen rakenteen säilyttäen. Nämä tekniikat ovat erityisen tehokkaita aloilla, joilla data muodostaa luonnollisesti verkoston, kuten sosiaalisissa verkostoissa tai biologisissa verkostoissa.
Toinen lähestymistapa ohjatun ja ohjaamattoman oppimisen yhdistämiseen on usean tehtävän oppiminen. Monitehtäväoppimisessa ratkaistaan useita oppimistehtäviä samanaikaisesti, samalla kun hyödynnetään tehtävien yhteisiä piirteitä ja eroja. Tämä voidaan nähdä eräänä induktiivisen siirron muotona, jossa yhdestä tehtävästä saatu tieto auttaa parantamaan toisen oppimista. Monitehtäväoppiminen voi olla erityisen hyödyllistä, kun tehtävien välillä on jaettu esitys- tai ominaisuustila, mikä mahdollistaa tiedon siirron.
Käytännön esimerkki puoliohjatusta oppimisesta on luonnollisen kielen käsittelyn (NLP) alalla. Harkitse mielipideanalyysin tehtävää, jossa tavoitteena on luokitella annettu teksti positiiviseksi tai negatiiviseksi. Merkittyjä tietoja, kuten mielipidetunnisteilla varustettuja arvosteluja, voidaan rajoittaa. Käytettävissä on kuitenkin valtava määrä nimeämätöntä tekstiä. Puolivalvottu oppimislähestymistapa voisi sisältää tunneluokittajan koulutuksen merkityille tiedoille ja sen käyttämisen merkitsemättömän datan tunteen ennustamiseen. Näitä ennusteita voidaan sitten käyttää lisäharjoittelutietona, mikä parantaa luokittelijan suorituskykyä.
Toinen esimerkki löytyy kuvien luokittelusta. Usein merkittyjen kuvien saaminen on työlästä ja kallista, kun taas merkitsemättömiä kuvia on runsaasti. Puolivalvottu lähestymistapa saattaa sisältää pienen joukon merkittyjä kuvia käyttämään alkuperäisen mallin harjoittelua. Tätä mallia voitaisiin sitten soveltaa merkitsemättömiin kuviin pseudotunnisteiden luomiseksi, joita käytetään myöhemmin mallin uudelleenkouluttamiseen.
Ohjatun ja ohjaamattoman oppimisen integrointi puoliohjatun oppimisen ja siihen liittyvien metodologioiden kautta edustaa tehokasta lähestymistapaa koneoppimiseen. Hyödyntämällä molempien paradigmien vahvuuksia on mahdollista saavuttaa merkittäviä parannuksia mallin suorituskykyyn erityisesti aloilla, joilla merkittyä dataa on rajoitetusti, mutta merkitsemätöntä dataa on runsaasti. Tämä lähestymistapa ei ainoastaan paranna mallien kykyä yleistää rajoitetuista tiedoista, vaan tarjoaa myös vankemman kehyksen monimutkaisten tietojoukkojen taustarakenteen ymmärtämiselle.
Muita viimeaikaisia kysymyksiä ja vastauksia liittyen EITC/AI/GCML Google Cloud Machine Learning:
- Miten päätät, mitä koneoppimisalgoritmia käytät ja miten löydät sen?
- Mitä eroa on Federated learning ja Edge Computing & On-Device Machine Learning välillä?
- Kuinka valmistella ja puhdistaa tiedot ennen harjoittelua?
- Tarkoitin toimintoja, kuten luokittelua, tunnistamista jne. Haluaisin luettelon kaikista mahdollisista toiminnoista ja selityksen siitä, mitä kullakin tarkoitetaan.
- Mitä toimintoja ML:llä voi tehdä ja miten niitä voidaan käyttää?
- Mitkä ovat nyrkkisäännöt tietyn strategian hyväksymiselle? Voitko ilmoittaa erityiset parametrit, jotka saavat minut ymmärtämään, kannattaako käyttää monimutkaisempaa mallia?
- Millä parametrilla ymmärrän, onko aika siirtyä lineaarisesta mallista syvään oppimiseen?
- Mikä Python-versio olisi paras TensorFlow'n asentamiseen, jotta vältetään ongelmat, kun TF-jakeluja ei ole saatavilla?
- Mikä on syvä neuroverkko?
- Kuinka kauan koneoppimisen perusteiden oppiminen yleensä kestää?
Katso lisää kysymyksiä ja vastauksia EITC/AI/GCML Google Cloud Machine Learningissä