Rilevamento di oggetti e concetti - Amazon Rekognition

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Rilevamento di oggetti e concetti

Questa sezione fornisce informazioni per rilevare le etichette nelle immagini e nei video con Immagini Amazon Rekognition e Video Amazon Rekognition.

Un'etichetta o tag è un oggetto o un concetto (incluse scene o azioni) rilevato in un'immagine o un video in base ai relativi contenuti. Ad esempio, un'immagine di persone su una spiaggia tropicale può contenere etichette come Palma (oggetto), Spiaggia (scena), Corsa (azione) e Ambiente esterno (concept).

Etichette supportate dalle operazioni di rilevamento delle etichette di Rekognition

  • Per scaricare l'elenco più recente di etichette e riquadri di delimitazione degli oggetti supportati da Amazon Rekognition, fai clic qui.

  • Per scaricare l'elenco precedente di etichette e riquadri di delimitazione degli oggetti, fai clic qui.

Nota

Amazon Rekognition fa previsioni binarie di genere (uomo, donna, ragazza, ecc.) basate sull'aspetto fisico di una persona in una particolare immagine. Questo tipo di previsione non è progettata per categorizzare l'identità di genere di una persona e non è necessario utilizzare Amazon Rekognition per determinare tale indicazione. Ad esempio, un attore maschio che indossa una parrucca con i capelli lunghi e degli orecchini per un ruolo potrebbe essere considerato una donna.

L'uso di Amazon Rekognition per fare previsioni binarie di genere è più adatto per i casi d'uso in cui è necessario analizzare le statistiche aggregate sulla distribuzione di genere senza identificare utenti specifici. Ad esempio, la percentuale di utenti donne rispetto agli uomini su una piattaforma di social media.

Non è consigliabile utilizzare le previsioni binarie di genere per prendere decisioni che influiscono sui diritti, sulla privacy o sull'accesso ai servizi di un individuo.

Amazon Rekognition restituisce le etichette in inglese. Puoi usare Amazon Translate per tradurre etichette inglesi in altre lingue.

Il diagramma seguente mostra l'ordine delle operazioni di chiamata, a seconda degli obiettivi per l'utilizzo delle operazioni Amazon Rekognition Image o Amazon Rekognition Video:

Diagramma che mostra i flussi di lavoro di analisi di immagini e video con elaborazione video archiviata e in streaming.

Etichetta oggetti di risposta

Riquadri di delimitazione

Immagini Amazon Rekognition e Video Amazon Rekognition è in grado di restituire il riquadro di delimitazione per vari oggetti comuni, come ad esempio automobili, mobili, abbigliamento o animali. Le informazioni relative ai riquadri non vengono restituite per le etichette di oggetti meno comuni. Puoi utilizzare i riquadri di delimitazione per trovare l'esatta ubicazione degli oggetti all'interno di un'immagine, contare le istanze di oggetti rilevati o misurare le dimensioni di un oggetto tramite quelle del riquadro.

Ad esempio, nell'immagine seguente, Immagini Amazon Rekognition è in grado di rilevare la presenza di una persona, uno skateboard, auto parcheggiate e altre informazioni. Immagini Amazon Rekognition restituisce anche il riquadro di delimitazione per una persona rilevata e altri oggetti rilevati come auto e ruote.

Persona che fa un'acrobazia con lo skateboard tra auto parcheggiate in una strada cittadina.

Punteggio di attendibilità

Video Amazon Rekognition e Immagini Amazon Rekognition forniscono un punteggio percentuale che indica la fiducia di Amazon Rekognition nella precisione di ogni etichetta rilevata.

Genitori

Immagini Amazon Rekognition e Video Amazon Rekognition utilizzano una tassonomia gerarchica delle etichette dei predecessori per classificare le etichette. Ad esempio, una persona che cammina su una strada potrebbe essere rilevata come Pedone. L'etichetta padre di Pedone è Persona. Nella risposta vengono restituite entrambe le etichette. Tutti predecessori vengono restituiti e una determinata etichetta contiene un elenco con l'etichetta padre e altri predecessori. Ad esempio, potrebbero essere indicate l'etichetta nonno e bisnonno (se esistenti). Le etichette padre possono essere usate per creare gruppi di etichette correlate e consentire l'esecuzione di query di etichette simili in una o più immagini. Ad esempio, una query per tutti i Veicoli potrebbe restituire un'auto da un'immagine e una moto da un'altra.

Categories

Immagini Amazon Rekognition e Video Amazon Rekognition restituiscono informazioni sulle categorie di etichette. Le etichette fanno parte di categorie che raggruppano singole etichette in base a funzioni e contesti comuni, come «Veicoli e automobili» e «Prodotti alimentari e bevande». Una categoria di etichette può essere una sottocategoria di una categoria principale.

Alias

Oltre a restituire le etichette, Immagini Amazon Rekognition e Video Amazon Rekognition restituiscono tutti gli alias associati all'etichetta. Gli alias sono etichette con lo stesso significato o etichette visivamente intercambiabili con l'etichetta principale restituita. Ad esempio, «Telefono cellulare» è un alias di «Telefono mobile».

Nelle versioni precedenti, Immagini Amazon Rekognition restituiva alias come «Telefono cellulare» nello stesso elenco di nomi di etichette primarie che contenevano «Telefono mobile». Immagini Amazon Rekognition ora restituisce «Telefono cellulare» in un campo chiamato «alias» e «Telefono mobile» nell'elenco dei nomi delle etichette principali. Se l'applicazione si basa sulle strutture restituite da una versione precedente di Rekognition, potrebbe essere necessario trasformare la risposta corrente restituita dalle operazioni di rilevamento delle etichette di immagini o video nella struttura di risposta precedente, in cui tutte le etichette e gli alias vengono restituiti come etichette primarie.

Se devi trasformare la risposta corrente dalla DetectLabels API (per il rilevamento delle etichette nelle immagini) alla struttura di risposta precedente, consulta l'esempio di codice in. Trasformazione della risposta DetectLabels

Se devi trasformare la risposta corrente dalla GetLabelDetection API (per il rilevamento delle etichette nei video memorizzati) alla struttura di risposta precedente, consulta l'esempio di codice inTrasformazione della risposta GetLabelDetection .

Proprietà immagine

Immagini Amazon Rekognition restituisce informazioni sulla qualità dell'immagine (nitidezza, luminosità e contrasto) per l'intera immagine. La nitidezza e la luminosità vengono restituite anche per il primo piano e lo sfondo dell'immagine. Le proprietà dell’immagine possono essere usate anche per rilevare i colori dominanti nell'intera immagine, in primo piano, sullo sfondo e negli oggetti con riquadri di delimitazione.

L'immagine di un'auto verde su una strada cittadina, con l'auto circondata da un riquadro di delimitazione.

Di seguito è riportato un esempio dei ImageProperties dati contenuti nella risposta di un' DetectLabels operazione per l'immagine successiva:

Tabella che mostra i colori dominanti e le metriche di qualità dell'immagine per un'intera immagine, il primo piano, lo sfondo e un oggetto di esempio con un riquadro di delimitazione.

Proprietà immagine non è disponibile per Video Amazon Rekognition.

Versione del modello

Immagini Amazon Rekognition e Video Amazon Rekognition restituiscono la versione del modello utilizzato per rilevare le etichette in un'immagine o un video archiviato.

Filtri di inclusione ed esclusione

Puoi filtrare i risultati restituiti dalle operazioni di rilevamento delle etichette di Immagini Amazon Rekognition e Video Amazon Rekognition. Filtra i risultati fornendo criteri di filtrazione per etichette e categorie. I filtri per etichette possono essere inclusivi o esclusivi.

Consulta Rilevamento di etichette in un'immagine per ulteriori informazioni sulla filtrazione dei risultati ottenuti con DetectLabels.

Consulta Rilevamento di etichette in un video per ulteriori informazioni sulla filtrazione dei risultati ottenuti da GetLabelDetection.

Ordinamento e aggregazione di risultati

I risultati ottenuti da determinate operazioni di Video Amazon Rekognition possono essere ordinati e aggregati in base a timestamp e segmenti video. Quando recuperi i risultati di un processo di rilevamento delle etichette o di moderazione dei contenuti, con GetLabelDetection o GetContentModeration rispettivamente, puoi utilizzare gli argomenti SortBy e AggregateBy per specificare come desideri che vengano restituiti i risultati. È possibile utilizzare SortBy con TIMESTAMP o NAME (nomi delle etichette) e utilizzare TIMESTAMPS o SEGMENTS con l'argomento. AggregateBy