Miten BLEU-pisteitä voidaan käyttää arvioitaessa mukautetun AutoML-käännösmallin suorituskykyä?

by EITCA-akatemia / Keskiviikkona 02 elokuu 2023 / Julkaistu Tekoäly, EITC/AI/GCML Google Cloud Machine Learning, Google Cloud AI -alusta, AutoML-käännös, Kokeen tarkistus

BLEU-pistemäärä on laajalti käytetty mittari konekäännösmallien suorituskyvyn arvioimiseksi. Se mittaa samankaltaisuutta koneellisesti luodun käännöksen ja yhden tai useamman viitekäännöksen välillä. AutoML Translationilla koulutetun mukautetun käännösmallin yhteydessä BLEU-pisteet voivat tarjota arvokasta tietoa mallin tulosteen laadusta ja tehokkuudesta.

Ymmärtääksesi, miten BLEU-pistemäärää käytetään, on tärkeää ensin ymmärtää taustalla olevat käsitteet. BLEU on lyhenne sanoista Bilingual Evaluation Understudy, ja se kehitettiin tapaksi arvioida automaattisesti konekäännösten laatua vertaamalla niitä ihmisen luomiin viitekäännöksiin. Pisteet vaihtelevat 0–1, ja korkeampi pistemäärä osoittaa parempaa käännöstä.

AutoML Translation on Google Cloud AI Platformin tarjoama tehokas työkalu, jonka avulla käyttäjät voivat kouluttaa mukautettuja käännösmalleja käyttämällä omia tietojaan. Kun malli on koulutettu, sitä voidaan käyttää käännösten luomiseen uudelle syöttöteksille. BLEU-pisteitä voidaan sitten käyttää näiden käännösten laadun arvioimiseen.

BLEU-pistemäärän laskemiseksi mallin luomia käännöksiä verrataan yhteen tai useampaan viitekäännökseen. Vertailu perustuu n-grammiin, jotka ovat n:n sanan peräkkäisiä sarjoja. BLEU-pistemäärässä ei huomioida vain n-grammien tarkkuutta mallin luomassa käännöksessä, vaan myös niiden läsnäolo viitekäännöksissä. Tämä auttaa vangitsemaan sekä käännösten riittävyyden että sujuvuuden.

Havainnollistetaan tätä esimerkillä. Oletetaan, että meillä on viitekäännös: "Kissa istuu matolla." Ja malli luo seuraavan käännöksen: "Kissa istuu matolla." Voimme jakaa nämä lauseet n-grammeiksi:

Viite: ["The", "kissa", "on", "istuu", "päällä", "the", "matto"] Malli: ["The", "kissa", "istuu", "päällä", "the", "matto"]

Tässä tapauksessa malli kääntää oikein suurimman osan n-grammeista, mutta se jättää huomiotta verbiajan ("on" vs. "istuu"). BLEU-pisteet heijastaisivat tätä antamalla käännökselle alemman pistemäärän.

BLEU-pisteet voidaan laskea useilla eri menetelmillä, kuten muunnetulla tarkkuudella ja lyhyydellä. Muokattu tarkkuus selittää sen, että käännös voi sisältää useita esiintymiä n-grammia, kun taas lyhyysrangaistus rankaisee käännöksiä, jotka ovat huomattavasti lyhyempiä kuin referenssikäännökset.

Arvioimalla AutoML Translationilla koulutetun mukautetun käännösmallin BLEU-pisteet käyttäjät voivat saada käsityksen mallin suorituskyvystä ja tunnistaa parannuskohteita. He voivat vertailla eri mallien tai iteraatioiden BLEU-pisteitä seuratakseen edistymistä ja tehdäkseen tietoisia päätöksiä mallien valinnasta tai hienosäädöstä.

BLEU-pisteet ovat arvokkaita arvioitaessa AutoML Translationilla koulutettujen mukautettujen käännösmallien suorituskykyä. Se tarjoaa kvantitatiivisen mittarin koneellisten käännösten laadusta vertaamalla niitä viitekäännöksiin. Analysoimalla BLEU-pisteitä käyttäjät voivat arvioida malliensa tehokkuutta ja tehdä datalähtöisiä päätöksiä parantaakseen käännösten laatua.

Muita viimeaikaisia kysymyksiä ja vastauksia liittyen AutoML-käännös:

Lisää kysymyksiä ja vastauksia:

Ala: Tekoäly
ohjelmat: EITC/AI/GCML Google Cloud Machine Learning (mene sertifiointiohjelmaan)
Oppitunti: Google Cloud AI -alusta (mene aiheeseen liittyvälle oppitunnille)
Aihe: AutoML-käännös (mene vastaavaan aiheeseen)
Kokeen tarkistus

Tagged alla: Tekoäly, AutoML-käännös, BLEU Pisteet, Arviointitiedot, Google Cloud AI -alusta, Konekäännös

EITCA-akatemia

Miten BLEU-pisteitä voidaan käyttää arvioitaessa mukautetun AutoML-käännösmallin suorituskykyä?

Muita viimeaikaisia kysymyksiä ja vastauksia liittyen AutoML-käännös:

Lisää kysymyksiä ja vastauksia:

EITCA Academy on osa eurooppalaista IT-sertifiointikehystä

Tukikelpoisuus EITCA Academylle 80% EITCI DSJC -tuki

EITCA-akatemia

Kirjaudu sisään tilillesi käyttäjänimelläsi tai sähköpostiosoitteellasi

FORGOT YKSITYISKOHDAT?

LUO TILI

Miten BLEU-pisteitä voidaan käyttää arvioitaessa mukautetun AutoML-käännösmallin suorituskykyä?

Muita viimeaikaisia ​​kysymyksiä ja vastauksia liittyen AutoML-käännös:

Lisää kysymyksiä ja vastauksia:

Tukikelpoisuus EITCA Academylle 80% EITCI DSJC -tuki

Muita viimeaikaisia kysymyksiä ja vastauksia liittyen AutoML-käännös: