Guida introduttiva: crea un lavoro di etichettatura dei riquadri delimitatori con Ground Truth - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Guida introduttiva: crea un lavoro di etichettatura dei riquadri delimitatori con Ground Truth

Per iniziare a usare Amazon SageMaker Ground Truth, segui le istruzioni nelle seguenti sezioni. Le seguenti sezioni spiegano come utilizzare la console per creare un processo di etichettatura bounding box, assegnare una forza lavoro pubblica o privata e inviare il lavoro di etichettatura alla tua forza lavoro. Viene spiegato anche come monitorare lo stato di avanzamento di un processo di etichettatura.

Questo video mostra come configurare e utilizzare Amazon SageMaker Ground Truth. (Durata: 9:37)

Se desideri creare un flusso di lavoro di etichettatura personalizzato, consulta Flussi di lavoro di etichettatura personalizzati per istruzioni.

Prima di creare un processo di etichettatura, devi caricare il set di dati in un bucket Amazon S3. Per ulteriori informazioni, consulta Usa dati di input e output.

Prima di iniziare

Prima di iniziare a utilizzare la console SageMaker AI per creare un processo di etichettatura, devi configurare il set di dati per l'uso. Esegui questa operazione:

  1. Salva due immagini su HTTP disponibile pubblicamente. URLs Le immagini vengono utilizzate durante la creazione di istruzioni per il completamento di un'attività di etichettatura. La proporzione delle immagini deve essere di circa 2:1. Per questo esercizio, il contenuto delle immagini non è importante.

  2. Crea un bucket Amazon S3 per contenere i file di input e output. Il bucket deve trovarsi nella stessa Regione in cui si esegue Ground Truth. Prendi nota del nome del bucket perché verrà utilizzato durante la fase 2.

    Ground Truth richiede che tutti i bucket S3 che contengono dati di immagine di input del processo di etichettatura abbiano una policy CORS collegata. Per ulteriori informazioni su questa modifica, consulta Requisito CORS per i dati delle immagini di input.

  3. Puoi creare un ruolo IAM o lasciare che l' SageMaker IA crei un ruolo con la policy AmazonSageMakerFullAccessIAM. Consulta Creating IAM roles e assegna la seguente policy di autorizzazione all'utente che crea il processo di etichettatura:

    { "Version": "2012-10-17", "Statement": [ { "Sid": "sagemakergroundtruth", "Effect": "Allow", "Action": [ "cognito-idp:CreateGroup", "cognito-idp:CreateUserPool", "cognito-idp:CreateUserPoolDomain", "cognito-idp:AdminCreateUser", "cognito-idp:CreateUserPoolClient", "cognito-idp:AdminAddUserToGroup", "cognito-idp:DescribeUserPoolClient", "cognito-idp:DescribeUserPool", "cognito-idp:UpdateUserPool" ], "Resource": "*" } ] }

Creazione di un processo di etichettatura

In questa fase utilizza la console per creare un processo di etichettatura. Comunichi ad Amazon SageMaker Ground Truth il bucket Amazon S3 in cui è archiviato il file manifest e configuri i parametri per il processo. Per ulteriori informazioni sull'archiviazione dei dati in un bucket Amazon S3, consulta Usa dati di input e output.

Per creare un processo di etichettatura
  1. Apri la console SageMaker AI all'indirizzo. https://console.aws.amazon.com/sagemaker/

  2. Nel riquadro di navigazione sinistro, scegli Processi di etichettatura.

  3. Scegli Crea processo di etichettatura per avviare il processo di creazione.

  4. Nella sezione Panoramica del processo, inserisci le informazioni seguenti:

    • Nome processo: assegna al processo di etichettatura un nome che descriva il processo. Questo nome viene mostrato nell'elenco dei processi. Il nome deve essere univoco nel tuo account in una AWS regione.

    • Nome attributo dell'etichetta: lascialo deselezionato poiché il valore predefinito è l'opzione migliore per questo processo introduttivo.

    • Configurazione dei dati di input: seleziona Configurazione automatica dei dati. Questa opzione ti consente di connetterti automaticamente ai dati di input in S3.

    • Posizione S3 per i set di dati di input: inserisci la posizione S3 in cui hai aggiunto le immagini nella fase 1.

    • Posizione S3 per i set di dati di output: la posizione in cui i dati di output sono scritti in S3.

    • Tipo di dati: utilizza il menu a discesa per selezionare Immagine. Ground Truth utilizzerà tutte le immagini trovate nella posizione S3 per i set di dati di input come input per il processo di etichettatura.

    • Ruolo IAM: crea o scegli un ruolo IAM con la policy AmazonSageMakerFullAccess IAM allegata.

  5. Nella sezione Tipo di attività, per il campo Categoria attività, scegli Immagine.

  6. In Selezione attività, scegli Riquadro di delimitazione.

  7. Scegli Successivo per passare alla configurazione del processo di etichettatura.

Seleziona Workers

In questa fase puoi scegliere una forza lavoro per etichettare il set di dati. Si consiglia di creare una forza lavoro privata per testare Amazon SageMaker Ground Truth. Utilizza indirizzi e-mail per invitare i membri della forza lavoro. Se crei una forza lavoro privata in questa fase non potrai importare il pool di utenti di Amazon Cognito in seguito. Se desideri creare una forza lavoro privata utilizzando un pool di utenti di Amazon Cognito, consulta Gestisci una forza lavoro privata (Amazon Cognito) e utilizza invece la forza lavoro di Mechanical Turk in questo tutorial.

Suggerimento

Per ulteriori informazioni sulle altre opzioni relative alla forza lavoro che puoi utilizzare con Ground Truth, consulta Forza lavoro.

Per creare una forza lavoro privata:
  1. Nella sezione Worker scegli Privata.

  2. Se è la prima volta che utilizzi una forza lavoro privata, nel campo Indirizzi e-mail, inserisci un massimo di 100 indirizzi e-mail. Gli indirizzi devono essere separati da una virgola. È opportuno includere il proprio indirizzo e-mail in modo da far parte della forza lavoro e visualizzare le attività di etichettatura degli oggetti dati.

  3. Nel campo Nome organizzazione, inserisci il nome dell'organizzazione. Queste informazioni vengono utilizzate per personalizzare l'e-mail inviata per invitare una persona nella forza lavoro privata. Puoi modificare il nome dell'organizzazione dopo la creazione del pool di utenti tramite la console.

  4. Nel campo E-mail di contatto inserisci un indirizzo e-mail utilizzato dai membri della forza lavoro per segnalare problemi con l'attività.

Se ti aggiungi alla forza lavoro privata, riceverai un'e-mail simile alla seguente. Amazon, Inc. viene sostituita dall'organizzazione inserita nella fase 3 della procedura precedente. Seleziona il link contenuto nell'e-mail per accedere utilizzando la password temporanea fornita. Se richiesto, modifica la password. Una volta effettuato correttamente l'accesso, viene visualizzato il portale dei worker in cui vengono visualizzate le attività di etichettatura.

Esempio di invito via e-mail a lavorare su un progetto di etichettatura.
Suggerimento

Puoi trovare il link al portale dei lavoratori della tua forza lavoro privata nella sezione Labeling workforces dell'area Ground Truth della SageMaker console AI. Per vedere il link, seleziona la scheda Privato. Il link si trova sotto l'intestazione URL di accesso portale di etichettatura in Riepilogo forza lavoro privata.

Se scegli di utilizzare la forza lavoro di Amazon Mechanical Turk per etichettare il set di dati, ti vengono addebitati i costi delle attività di etichettatura completate nel set di dati.

Per utilizzare la forza lavoro di Amazon Mechanical Turk:
  1. Nella sezione Worker, scegli Pubblica.

  2. Imposta un Prezzo per attività.

  3. Se applicabile, scegli Il dataset non contiene contenuti per adulti per confermare che il set di dati di esempio non include contenuti per adulti. Queste informazioni consentono ad Amazon SageMaker Ground Truth di avvisare i lavoratori esterni di Mechanical Turk che potrebbero trovare contenuti potenzialmente offensivi nel tuo set di dati.

  4. Seleziona la casella di controllo accanto alla seguente dichiarazione per confermare che il set di dati di esempio non contiene informazioni di identificazione personale (PII). Questo è un requisito per utilizzare Mechanical Turk con Ground Truth. Se i dati di input contengono informazioni personali, utilizza la forza lavoro privata per questo tutorial.

    Comprendi e accetti che la forza lavoro di Amazon Mechanical Turk è composta da collaboratori indipendenti dislocati in tutto il mondo e che non devi condividere informazioni riservate, informazioni personali o informazioni sanitarie protette con questa forza lavoro.

Configura lo strumento Bounding Box

Per finire, configura lo strumento riquadro di delimitazione per fornire istruzioni ai worker. Puoi configurare un titolo attività che descrive l'attività e fornisce istruzioni di alto livello per i worker. È possibile fornire sia istruzioni rapide che le istruzioni complete. Le istruzioni rapide vengono visualizzate accanto all'immagine da etichettare. Le istruzioni complete contengono istruzioni dettagliate per il completamento dell'attività. In questo esempio vengono fornite solo istruzioni rapide. Per visualizzare un esempio di istruzioni complete, scegli Istruzioni complete nella parte inferiore della sezione.

Per configurare lo strumento riquadro di delimitazione
  1. Nel campo Descrizione attività digita istruzioni brevi per l'attività. Per esempio:

    Draw a box around any objects in the image.

    Sostituiscilo objects con il nome di un oggetto che appare nelle tue immagini.

  2. Nel campo Etichette, digita un nome di categoria per gli oggetti che il worker deve racchiudere con un riquadro di delimitazione. Ad esempio, se viene chiesto al worker di disegnare caselle attorno a calciatori, è possibile utilizzare "FootballPlayer" in questo campo.

  3. La sezione Istruzioni brevi consente di creare le istruzioni che vengono visualizzate nella pagina con l'immagine che i worker stanno etichettando. Ti consigliamo di includere un esempio di riquadro di delimitazione correttamente disegnato e un esempio di riquadro disegnato erroneamente. Per creare le tue istruzioni, utilizza queste fasi:

    1. Seleziona il testo tra GOOD EXAMPLE e il segnaposto dell'immagine. Sostituiscilo con il testo seguente:

      Draw the box around the object with a small border.

    2. Seleziona il primo segnaposto dell'immagine ed eliminarlo.

    3. Scegli il pulsante immagine, quindi immetti l'URL HTTPS di una delle immagini create nella fase 1. Puoi anche incorporare immagini direttamente nella sezione delle istruzioni brevi, tuttavia questa sezione ha una quota di 100 kilobyte (testo incluso). Se le immagini e il testo superano i 100 kilobyte, visualizzerai un messaggio di errore.

    4. Seleziona il testo tra BAD EXAMPLE e il segnaposto dell'immagine. Sostituiscilo con il testo seguente:

      Don't make the bounding box too large or cut into the object.

    5. Seleziona il secondo segnaposto dell'immagine ed eliminarlo.

    6. Scegli il pulsante immagine, quindi immetti l'URL HTTPS dell'altra immagine creata nella fase 1.

  4. Seleziona Anteprima per visualizzare l'anteprima dell'interfaccia utente del worker. L'anteprima si apre in una nuova scheda, quindi se il browser blocca i popup, potrebbe essere necessario abilitare manualmente l'apertura della scheda. Quando aggiungi una o più annotazioni all'anteprima e poi selezioni Invia, puoi vedere un'anteprima dei dati di output che l'annotazione creerebbe.

  5. Dopo aver configurato e verificato le istruzioni, seleziona Crea per creare il processo di etichettatura.

Se hai utilizzato una forza lavoro privata, puoi accedere al portale dei worker a cui è stato effettuato l'accesso in Seleziona Workers di questo tutorial per visualizzare le tue attività di etichettatura. Potrebbero essere necessari alcuni minuti per la visualizzazione dell’attività.

Ora che hai creato un lavoro di etichettatura, puoi monitorarlo o interromperlo.