Voit hyödyntää Google Cloud Vision API:n tehokkaita ominaisuuksia, jos haluat ohjelmallisesti poimia tunnisteita kuvista Pythonin ja Vision API:n avulla. Vision API tarjoaa kattavan joukon kuva-analyysiominaisuuksia, mukaan lukien tarratunnistuksen, jonka avulla voit automaattisesti tunnistaa ja poimia tarroja kuvista.
Aloittaaksesi sinun on määritettävä Google Cloud -projekti ja otettava Vision API käyttöön. Kun olet tehnyt sen, voit asentaa tarvittavat Python-kirjastot suorittamalla seuraavan komennon:
python pip install google-cloud-vision
Seuraavaksi sinun on todennettava sovelluksesi, jotta voit käyttää Vision API:ta. Voit tehdä tämän luomalla palvelutilin avaimen ja asettamalla GOOGLE_APPLICATION_CREDENTIALS -ympäristömuuttujan osoittamaan avaintiedoston polkuun. Tämä voidaan tehdä käyttämällä seuraavaa koodia:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Nyt voit käyttää Vision APIa tarrojen ohjelmalliseen poimimiseen kuvista. Seuraava koodinpätkä näyttää, kuinka tämä tehdään:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
Tässä koodissa luomme ensin ImageAnnotatorClient-luokan esiintymän google.cloud.vision-kirjastosta. Tämän jälkeen luemme kuvatiedoston, luomme tiedoston sisällöstä "Image"-objektin ja lähetämme sen Vision API:lle tarran havaitsemista varten. API-vastaus sisältää luettelon tarramerkinnöistä, joista poimimme tarrojen kuvaukset.
Voit nyt kutsua toimintoa "extract_labels" välittämällä polun analysoitavaan kuvatiedostoon. Se palauttaa luettelon kuvasta poimituista tarroista.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Tämä tulostaa kuvasta poimitut tarrat.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API käyttää edistyneitä koneoppimismalleja kuvien analysointiin ja kohteiden, kohtausten ja muiden visuaalisten ominaisuuksien tunnistamiseen. Se tunnistaa tarkasti laajan valikoiman tarroja, mikä tekee siitä arvokkaan työkalun erilaisiin sovelluksiin, kuten kuvien luokitteluun, sisällön valvontaan ja visuaaliseen hakuun.
Jotta voit ohjelmoida tunnisteita kuvista Pythonin ja Vision API:n avulla, sinun on määritettävä Google Cloud -projekti, otettava Vision-sovellusliittymä käyttöön, asennettava tarvittavat Python-kirjastot, todettava sovelluksesi ja käytettävä Vision API -sovellusta tarratunnistuksen suorittamiseen kuvia. Poimittuja tarroja voidaan käyttää lisäanalyysiin tai kuvan sisällön ymmärtämisen parantamiseen.
Muita viimeaikaisia kysymyksiä ja vastauksia liittyen EITC/AI/GVAPI Google Vision -sovellusliittymä:
- Mitä ennalta määritettyjä luokkia on Google Vision API:n objektien tunnistukseen?
- Ottaako Google Vision API käyttöön kasvojentunnistuksen?
- Miten näyttöteksti voidaan lisätä kuvaan piirrettäessä objektien reunoja "draw_vertices"-funktiolla?
- Mitkä ovat "draw.line"-menetelmän parametrit toimitetussa koodissa ja miten niitä käytetään piirtämään viivoja kärkiarvojen välille?
- Kuinka tyynykirjastoa voidaan käyttää objektien reunojen piirtämiseen Pythonissa?
- Mikä on "draw_vertices"-funktion tarkoitus toimitetussa koodissa?
- Kuinka Google Vision API voi auttaa ymmärtämään kuvan muotoja ja esineitä?
- Kuinka käyttäjät voivat tutkia visuaalisesti samankaltaisia API:n suosittelemia kuvia?
- Mitä eri elementtejä tarjotaan Google Vision API:n verkkotunnistusominaisuuden vastausobjektissa?
- Miten Web Detection -ominaisuus auttaa luomaan tunnisteita ladatuille kuville?
Katso lisää kysymyksiä ja vastauksia EITC/AI/GVAPI Google Vision API:ssa