Tekoälyn (AI) ja erityisesti Google Cloud Machine Learning -verkkotunnuksen yhteydessä merkityt tiedot viittaavat tietojoukkoon, joka on merkitty tai merkitty tietyillä tunnisteilla tai luokilla. Nämä merkinnät toimivat perustotuuksina tai referenssinä koneoppimisalgoritmien koulutuksessa. Yhdistämällä datapisteitä vastaaviin tunnisteisiin koneoppimismalli voi oppia tunnistamaan kuvioita ja tekemään ennusteita uuden, ennennäkemättömän datan perusteella.
Merkitty data on ratkaisevassa roolissa ohjatussa oppimisessa, joka on yleinen lähestymistapa koneoppimisessa. Valvotussa oppimisessa mallia opetetaan tunnistetulla tietojoukolla, jotta se oppii syöttöominaisuuksien ja niitä vastaavien tulosnimikkeiden välisen suhteen. Tämän koulutusprosessin avulla malli voi yleistää tietonsa ja tehdä tarkkoja ennusteita uudesta, näkemättömästä tiedosta.
Tämän käsitteen havainnollistamiseksi tarkastellaan esimerkkiä koneoppimistehtävästä kuvantunnistuksen alalla. Oletetaan, että haluamme rakentaa mallin, joka voi luokitella eläinten kuvat eri luokkiin, kuten kissoihin, koiriin ja lintuihin. Tarvitsemme nimetyn tietojoukon, jossa jokainen kuva on liitetty sen oikeaan tunnisteeseen. Esimerkiksi kissan kuva merkitään "kissaksi", koiran kuva "koiraksi" ja niin edelleen.
Merkitty tietojoukko koostuisi kokoelmasta kuvia ja niitä vastaavia tarroja. Jokainen kuva esitettäisiin joukolla ominaisuuksia, kuten kuvapistearvoja tai kuvasta poimittuja korkeamman tason esityksiä. Tarrat osoittaisivat oikean luokan tai luokan, johon kukin kuva kuuluu.
Koulutusvaiheessa koneoppimismalli esitettäisiin merkityn tietojoukon kanssa. Se oppii tunnistamaan kuvioita ja suhteita syöttöominaisuuksien ja vastaavien tarrojen välillä. Malli päivittäisi sisäiset parametrinsa minimoimaan eron sen ennusteiden ja opetustiedon todellisten merkintöjen välillä.
Kun malli on koulutettu, sitä voidaan käyttää ennustamaan uusia, näkymättömiä kuvia. Merkitsemättömän kuvan kohdalla malli analysoi sen ominaisuuksia ja ennustaisi todennäköisimmän nimiön merkitystä tietojoukosta oppimansa tiedon perusteella. Jos malli esimerkiksi ennustaa, että kuva sisältää kissan, se tarkoittaa, että se on tunnistanut kuvasta kuvioita, jotka viittaavat kissaan.
Merkitty data on peruskomponentti koneoppimismallien koulutuksessa. Se tarjoaa tarvittavat tiedot, jotta malli voi oppia ja tehdä tarkkoja ennusteita. Yhdistämällä datapisteitä vastaaviin merkintöihin malli voi oppia tunnistamaan kuvioita ja yleistämään tietonsa näkymättömään dataan.
Muita viimeaikaisia kysymyksiä ja vastauksia liittyen EITC/AI/GCML Google Cloud Machine Learning:
- Mikä on teksti puheeksi (TTS) ja miten se toimii tekoälyn kanssa?
- Mitä rajoituksia suurten tietojoukkojen kanssa työskentelyssä on koneoppimisessa?
- Voiko koneoppiminen auttaa dialogia?
- Mikä on TensorFlow-leikkipaikka?
- Mitä suurempi tietojoukko oikeastaan tarkoittaa?
- Mitkä ovat esimerkkejä algoritmin hyperparametreistä?
- Mitä on ansamble-oppiminen?
- Entä jos valittu koneoppimisalgoritmi ei sovi ja miten voidaan varmistaa, että valitaan oikea?
- Tarvitseeko koneoppimismalli valvontaa koulutuksensa aikana?
- Mitä avainparametreja käytetään neuroverkkopohjaisissa algoritmeissa?
Katso lisää kysymyksiä ja vastauksia EITC/AI/GCML Google Cloud Machine Learningissä