Utilizzo della forza lavoro Amazon Mechanical Turk - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo della forza lavoro Amazon Mechanical Turk

La forza lavoro di Amazon Mechanical Turk (Mechanical Turk) fornisce il maggior numero di lavoratori per il lavoro di etichettatura di Amazon Ground SageMaker Truth e per l'attività di revisione umana di Amazon Augmented AI. La forza lavoro Amazon Mechanical Turk è una risorsa mondiale. I lavoratori sono disponibili 24 ore al giorno, 7 giorni a settimana. In genere quando si utilizza la forza lavoro Amazon Mechanical Turk, si ottengono tempi di produzione minimi per le attività di etichettatura e le attività di revisione umana.

Qualsiasi fatturazione della forza lavoro Amazon Mechanical Turk viene gestita come parte della fatturazione di Ground Truth o Amazon IA aumentata. Non devi creare un account Mechanical Turk separato per utilizzare la forza lavoro Mechanical Turk.

Importante

Non devi condividere informazioni riservate, informazioni personali o informazioni sanitarie protette con questa forza lavoro. Non dovresti usare la forza lavoro di Amazon Mechanical Turk quando utilizzi Amazon A2I in combinazione con servizi AWS idonei all'HIPAA, come Amazon Textract e Amazon Rekognition, per carichi di lavoro contenenti informazioni sanitarie protette.

Puoi scegliere Mechanical Turk come forza lavoro quando crei un lavoro di etichettatura Ground Truth o un flusso di lavoro di revisione umana di Amazon A2I (definizione del flusso). Puoi creare un processo di etichettatura e un flusso di lavoro di revisione umana utilizzando la console e l'API. SageMaker

Quando utilizzi un'operazione API per creare un processo di etichettatura o un flusso di lavoro di revisione umana, utilizzi il seguente ARN per la forza lavoro Amazon Mechanical Turk per il tuo WorkteamArn. Sostituiscilo regioncon la AWS regione che stai utilizzando per creare il processo di etichettatura o i loop umani. Ad esempio, se crei un processo di etichettatura negli Stati Uniti occidentali (Oregon), sostituisci regiono con us-west-2.

  • arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

Ground Truth e Amazon A2I richiedono che i dati di input siano privi di informazioni di identificazione personale (PII) quando utilizzi Mechanical Turk. Se utilizzi la forza lavoro Mechanical Turk e non specifichi che i dati di input sono privi di informazioni personali, i processi di etichettatura di Ground Truth e le attività di Augmented AI avranno esito negativo. Devi specificare che i tuoi dati di input sono privi di PII quando crei un processo di etichettatura Ground Truth e quando crei un ciclo umano Amazon A2I utilizzando un'integrazione incorporata o un'operazione StartHumanLoop.

Usa le seguenti sezioni per imparare a usare Mechanical Turk con questi servizi.

Utilizzare Mechanical Turk con Ground Truth

Puoi utilizzare Mechanical Turk con Ground Truth quando crei un processo di etichettatura utilizzando la console o l'operazione CreateLabelingJob.

Quando crei un processo di etichettatura, ti consigliamo di regolare il numero di lavoratori che annotano ogni oggetto di dati in base alla complessità del processo e alla qualità di cui hai bisogno. Amazon SageMaker Ground Truth utilizza il consolidamento delle annotazioni per migliorare la qualità delle etichette. Più lavoratori possono fare la differenza nella qualità delle etichette per processi di etichettatura più complessi, ma potrebbero non fare la differenza per processi più semplici. Per ulteriori informazioni, consulta Consolidamento delle annotazioni. Tieni presente che il consolidamento delle annotazioni non è supportato per i flussi di lavoro di revisione umana Amazon A2I.

Per utilizzare Mechanical Turk quando crei un processo di etichettatura (console):
  1. Utilizzare quanto segue per creare un lavoro di etichettatura utilizzando l'area Ground Truth della SageMaker console:Creazione di un processo di etichettatura (console).

  2. Quando selezioni i tipi di lavoratori nella sezione Lavoratori, seleziona Amazon Mechanical Turk.

  3. Specifica la quantità totale di tempo a disposizione dei lavoratori per completare un'attività utilizzando Timeout attività.

  4. Specifica la quantità totale di tempo in cui un'attività rimane disponibile per i lavoratori in Scadenza attività. Questo è il tempo a disposizione dei lavoratori per completare un'attività prima che avvia esito negativo.

  5. Seleziona il Prezzo per attività utilizzando l'elenco a discesa. Questa è la somma di denaro che un lavoratore riceve per il completamento di una singola attività.

  6. (Facoltativo) Se applicabile, seleziona Il set di dati non contiene contenuti per adulti. SageMaker può limitare gli operatori di Mechanical Turk che possono visualizzare la tua attività se contiene contenuti per adulti.

  7. Devi leggere e confermare la seguente dichiarazione selezionando la casella di controllo per utilizzare la forza lavoro Mechanical Turk. Se i dati di input contengono informazioni riservate, informazioni personali o informazioni sanitarie protette, devi selezionare un'altra forza lavoro.

    Comprendi e accetti che la forza lavoro di Mechanical Turk è composta da collaboratori indipendenti dislocati in tutto il mondo e che non devi condividere informazioni riservate, informazioni personali o informazioni sanitarie protette con questa forza lavoro.

  8. (Facoltativo) Seleziona la casella di controllo accanto a Abilita l'etichettatura automatica dei dati se desideri abilitare l'etichettatura automatica dei dati. Per ulteriori informazioni su questa funzionalità, consulta Automatizza l'etichettatura dei dati.

  9. Puoi specificare il Numero di lavoratori per oggetto set di dati in Configurazione aggiuntiva. Ad esempio, se inserisci 3 in questo campo, ogni oggetto di dati verrà etichettato da 3 lavoratori.

Quando crei il tuo processo di etichettatura selezionando Crea, le tue attività di etichettatura vengono inviate ai lavoratori di Mechanical Turk.

Per utilizzare Mechanical Turk quando crei un processo di etichettatura (API):
  1. Per creare un processo di etichettatura utilizzando l’operazione CreateLabelingJob, usa quanto segue: Creazione di un processo di etichettatura (API).

  2. Utilizza quanto segue per il WorkteamArn. Sostituisci regioncon la AWS regione che stai utilizzando per creare il lavoro di etichettatura.

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. Usa TaskTimeLimitInSeconds per specificare la quantità totale di tempo a disposizione dei lavoratori per completare un'attività.

  4. Usa TaskAvailabilityLifetimeInSeconds per specificare la quantità totale di tempo in cui un'attività rimane disponibile per i lavoratori. Questo è il tempo a disposizione dei lavoratori per completare un'attività prima che avvia esito negativo.

  5. Usa NumberOfHumanWorkersPerDataObject per specificare il numero di lavoratori per oggetto set di dati.

  6. Usa PublicWorkforceTaskPrice per impostare il prezzo per attività. Questa è la somma di denaro che un lavoratore riceve per il completamento di una singola attività.

  7. Usa DataAttributes per specificare che i dati di input sono privi di informazioni riservate, informazioni personali o informazioni sanitarie protette.

    Ground Truth e richiede che i dati di input siano privi di informazioni di identificazione personale (PII) quando utilizzi la forza lavoro Mechanical Turk. Se utilizzi Mechanical Turk e non specifichi che i dati di input sono privi di informazioni personali utilizzando il flag FreeOfPersonallyIdentifiableInformation, il processo di etichettatura avrà esito negativo.

    Usa il FreeOfAdultContent flag per dichiarare che i tuoi dati di input sono privi di contenuti per adulti. SageMaker può limitare gli operatori di Mechanical Turk che possono visualizzare la tua attività se contiene contenuti per adulti.

Puoi vedere esempi di come utilizzare questa API nei seguenti notebook, disponibili su: Ground GitHub Truth Jupyter Notebook Examples. È possibile accedere a questi notebook nell'istanza In a notebook. SageMaker Accedi a taccuini di esempio

Usare Mechanical Turk con Amazon A2I

Puoi specificare che desideri utilizzare Mechanical Turk con Amazon A2I quando crei un flusso di lavoro di revisione umana, noto anche come definizione di flusso, nella console o con l’operazione API CreateFlowDefinition. Quando utilizzi questo flusso di lavoro di revisione umana per configurare i cicli umani, devi specificare che i dati di input non contengono informazioni personali.

Per utilizzare Mechanical Turk quando crei un flusso di lavoro di revisione umana (console):
  1. Utilizza quanto segue per creare un flusso di lavoro di revisione umana nella sezione Augmented AI SageMaker della consoleCreazione di un flusso di lavoro di revisione umana (Console):.

  2. Quando selezioni i tipi di lavoratori nella sezione Lavoratori, seleziona Amazon Mechanical Turk.

  3. Seleziona il Prezzo per attività utilizzando l'elenco a discesa. Questa è la somma di denaro che un lavoratore riceve per il completamento di una singola attività.

  4. (Facoltativo) Puoi specificare il Numero di lavoratori per oggetto set di dati in Configurazione aggiuntiva. Ad esempio, se inserisci 3 in questo campo, ogni oggetto di dati verrà etichettato da 3 lavoratori.

  5. (Facoltativo) Specifica la quantità totale di tempo a disposizione dei lavoratori per completare un'attività utilizzando Timeout attività.

  6. (Facoltativo) Specifica la quantità totale di tempo in cui un'attività rimane disponibile per i lavoratori in Scadenza attività. Questo è il tempo a disposizione dei lavoratori per completare un'attività prima che avvia esito negativo.

  7. Una volta creato il flusso di lavoro di revisione umana, puoi utilizzarlo per configurare un ciclo umano fornendo il relativo Amazon Resource Name (ARN) nel parametro FlowDefinitionArn. Puoi configurare un ciclo umano utilizzando una delle operazioni API di un tipo di attività integrata o l'operazione dell'API di runtime di Amazon A2I, StartHumanLoop. Per ulteriori informazioni, vedi Creazione e avvio di un ciclo umano.

    Quando configuri il ciclo umano, devi specificare che i dati di input sono privi di informazioni di identificazione personale (PII) utilizzando il classificatore di contenuti FreeOfPersonallyIdentifiableInformation in DataAttributes. Se utilizzi Mechanical Turk e non specifichi che i tuoi dati di input sono privi di PII, le tue attività di revisione umana falliranno.

    Usa il FreeOfAdultContent flag per dichiarare che i tuoi dati di input sono privi di contenuti per adulti. SageMaker può limitare gli operatori di Mechanical Turk che possono visualizzare la tua attività se contiene contenuti per adulti.

Per utilizzare Mechanical Turk quando crei un flusso di lavoro di revisione umana (API):
  1. Usa quanto segue per creare un flusso di lavoro di revisione umana utilizzando l'operazione CreateFlowDefinition: Creare un flusso di lavoro di revisione umana (API).

  2. Utilizza quanto segue per il WorkteamArn. Sostituisci regioncon la AWS regione che stai utilizzando per creare il lavoro di etichettatura.

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. Usa TaskTimeLimitInSeconds per specificare la quantità totale di tempo a disposizione dei lavoratori per completare un'attività.

  4. Usa TaskAvailabilityLifetimeInSeconds per specificare la quantità totale di tempo in cui un'attività rimane disponibile per i lavoratori. Questo è il tempo a disposizione dei lavoratori per completare un'attività prima che avvia esito negativo.

  5. Usa TaskCount per specificare il numero di lavoratori per oggetto set di dati. Ad esempio, se specifichi 3 per questo parametro, ogni oggetto di dati verrà etichettato da 3 lavoratori.

  6. Usa PublicWorkforceTaskPrice per impostare il prezzo per attività. Questa è la somma di denaro che un lavoratore riceve per il completamento di una singola attività.

  7. Una volta creato il flusso di lavoro di revisione umana, puoi utilizzarlo per configurare un ciclo umano fornendo il relativo Amazon Resource Name (ARN) nel parametro FlowDefinitionArn. Puoi configurare un ciclo umano utilizzando una delle operazioni API di un tipo di attività integrata o l'operazione dell'API di runtime di Amazon A2I, StartHumanLoop. Per ulteriori informazioni, vedi Creazione e avvio di un ciclo umano.

    Quando configuri il ciclo umano, devi specificare che i dati di input sono privi di informazioni di identificazione personale (PII) utilizzando il classificatore di contenuti FreeOfPersonallyIdentifiableInformation in DataAttributes. Se utilizzi Mechanical Turk e non specifichi che i tuoi dati di input sono privi di PII, le tue attività di revisione umana falliranno.

    Usa il FreeOfAdultContent flag per dichiarare che i tuoi dati di input sono privi di contenuti per adulti. SageMaker può limitare gli operatori di Mechanical Turk che possono visualizzare la tua attività se contiene contenuti per adulti.

Puoi vedere esempi di come utilizzare questa API nei seguenti notebook, disponibili su: GitHub Amazon A2I Jupyter Notebook Examples.

Quando Mechanical Turk non è supportato?

Questa forza lavoro non è supportata nei seguenti scenari. In ogni scenario, devi utilizzare una forza lavoro privata o di un fornitore.

  • Questa forza lavoro non è supportata per i processi di etichettatura di fotogrammi video Ground Truth e per i processi di etichettatura di nuvole di punti 3D.

  • Non puoi utilizzare questa forza lavoro se i dati di input contengono informazioni personali di identificazione (PII).

  • Mechanical Turk non è disponibile in alcune regioni AWS speciali. Se applicabile, consulta la documentazione relativa alla tua regione speciale per ulteriori informazioni.