Dati di output di Amazon A2I - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Dati di output di Amazon A2I

Quando il flusso di lavoro di machine learning invia ad Amazon A2I un oggetto di dati, viene creato un ciclo umano e i revisori umani ricevono un’attività per esaminare quell'oggetto di dati. I dati in output da ogni attività di revisione umana vengono archiviati nel bucket output Amazon Simple Storage Service (Amazon S3) specificato nel flusso di lavoro di revisione umana. Nel percorso dei dati, YYYY/MM/DD/hh/mm/ss rappresenta la data di creazione del ciclo umano con anno (YYYY), mese (MM) e giorno (DD) e l’ora di creazione con ora (hh), minute (mm) e secondi (ss).

s3://customer-output-bucket-specified-in-flow-definition/flow-definition-name/YYYY/MM/DD/hh/mm/ss/human-loop-name/output.json

Il contenuto dei dati di output dipende dal tipo di attività (integrata o personalizzata) e dal tipo di forza lavoro utilizzata. I dati di output includono sempre la risposta del worker umano. Inoltre, i dati di output possono includere metadati relativi al ciclo umano, al revisore umano (worker) e all'oggetto dei dati.

Utilizza le seguenti sezioni per saperne di più sul formato dei dati di output di Amazon A2I per diversi tipi di attività e forze di lavoro.

Dati di output da tipi di attività predefiniti

I tipi di attività predefiniti di Amazon A2I includono Amazon Textract e Amazon Rekognition. Oltre alle risposte umane, i dati di output di una di queste attività includono dettagli sul motivo per cui è stato creato il ciclo umano e informazioni sul servizio integrato utilizzato per creare il ciclo umano. Utilizza la tabella seguente per ulteriori informazioni sullo schema dei dati di output per tutti i tipi di attività predefiniti. Il valore per ciascuno di questi parametri dipende dal servizio utilizzato con Amazon A2I. Consulta la seconda tabella di questa sezione per ulteriori informazioni su questi valori specifici del servizio.

Parametro Tipo di valore Valori di esempio Descrizione
awsManagedHumanLoopRequestSource

Stringa

AWS/Rekognition/DetectModerationLabels/Image/V3 o AWS/Textract/AnalyzeDocument/Forms/V1 L'APIoperazione e AWS i servizi associati che hanno richiesto che Amazon A2I creasse un loop umano. Questa è l'APIoperazione che usi per configurare il tuo human loop di Amazon A2I.
flowDefinitionArn

Stringa

arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name

L'Amazon Resource Number (ARN) del flusso di lavoro di revisione umana (definizione del flusso) utilizzato per creare il ciclo umano.

humanAnswers

Elenco di JSON oggetti

{ "answerContent": { "AWS/Rekognition/DetectModerationLabels/Image/V3": { "moderationLabels": [...] } },
oppure
{ "answerContent": { "AWS/Textract/AnalyzeDocument/Forms/V1": { "blocks": [...] } },
Un elenco di JSON oggetti che contengono le risposte dei lavoratori inanswerContent.

Questo oggetto contiene anche i dettagli dell'invio e, se è stata utilizzata una forza lavoro privata, i metadati dei worker. Per ulteriori informazioni, consulta Monitorare l'attività worker.

Per i dati di output del ciclo umano prodotti dalle attività di revisione di DetectModerationLabel Amazon Rekognition, questo parametro contiene solo risposte positive. Ad esempio, se i worker selezionano Nessun contenuto, questa risposta non viene inclusa.

humanLoopName

Stringa

'human-loop-name'

Il nome del ciclo umano.
inputContent

JSONoggetto

{ "aiServiceRequest": {...}, "aiServiceResponse": {...}, "humanTaskActivationConditionResults": {...}, "selectedAiServiceResponse": {...} }

Il contenuto di input che il AWS servizio ha inviato ad Amazon A2I quando ha richiesto la creazione di un loop umano.

aiServiceRequest

JSONoggetto

{ "document": {...}, "featureTypes": [...], "humanLoopConfig": {...} }
oppure
{ "image": {...}, "humanLoopConfig": {...} }

La richiesta originale inviata al AWS servizio integrato con Amazon A2I. Ad esempio, se utilizzi Amazon Rekognition con Amazon A2I, ciò include la richiesta effettuata tramite l'operazione. API DetectModerationLabels Per le integrazioni Amazon Textract, ciò include la richiesta effettuata tramite AnalyzeDocument.

aiServiceResponse

JSONoggetto

{ "moderationLabels": [...], "moderationModelVersion": "3.0" }

oppure

{ "blocks": [...], "documentMetadata": {} }

La risposta completa del AWS servizio. Si tratta dei dati utilizzati per determinare se è necessaria una revisione umana. Questo oggetto può contenere metadati sull'oggetto dati che non sono condivisi con revisori umani.

selectedAiServiceResponse

JSONoggetto

{ "moderationLabels": [...], "moderationModelVersion": "3.0" }

oppure

{ "blocks": [...], "documentMetadata": {} }

Il sottoinsieme di aiServiceResponse che corrisponde alle condizioni di attivazione in ActivationConditions.

Tutti gli oggetti dati elencati in aiServiceResponse sono elencati nelle condizioni di attivazione selectedAiServiceResponse quando le inferenze vengono campionate casualmente o tutte le inferenze avviano le condizioni di attivazione.

humanTaskActivationConditionResults

JSONoggetto

{ "Conditions": [...] }

Un JSON oggetto inputContent che contiene il motivo per cui è stato creato un ciclo umano. Ciò include un elenco delle condizioni di attivazione (Conditions) incluse nel flusso di lavoro di revisione umana (definizione del flusso) e il risultato della valutazione per ciascuna condizione: questo risultato è true o false. Per maggiori informazioni sui termini di attivazione, consulta Schema JSON per condizioni attivazione del ciclo umano in Amazon Augmented AI.

Seleziona una scheda nella tabella seguente per informazioni sui parametri specifici del tipo di attività e visualizza un esempio di blocco di codice dei dati di output per ciascuno dei tipi di attività predefiniti.

Amazon Textract Task Type Output Data

Quando usi l'integrazione integrata di Amazon Textract, vedi 'AWS/Textract/AnalyzeDocument/Forms/V1' come valore per awsManagedHumanLoopRequestSource nei tuoi dati di output.

Il parametro answerContent contiene un oggetto Block che include le risposte umane per tutti i blocchi inviati ad Amazon A2I.

Il parametro aiServiceResponse include anche un oggetto Block con la risposta di Amazon Textract alla richiesta originale inviata tramite AnalyzeDocument.

Per ulteriori informazioni sui parametri che vedi nell'oggetto blocco, consulta Blocco nella Guida per gli sviluppatori Amazon Textract.

Di seguito è riportato un esempio dei dati di output di una revisione umana di Amazon A2I delle inferenze dell'analisi dei documenti di Amazon Textract.

{ "awsManagedHumanLoopRequestSource": "AWS/Textract/AnalyzeDocument/Forms/V1", "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanAnswers": [ { "answerContent": { "AWS/Textract/AnalyzeDocument/Forms/V1": { "blocks": [...] } }, "submissionTime": "2020-09-28T19:17:59.880Z", "workerId": "111122223333", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111", "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333" } } } ], "humanLoopName": "humnan-loop-name", "inputContent": { "aiServiceRequest": { "document": { "s3Object": { "bucket": "amzn-s3-demo-bucket1", "name": "document-demo.jpg" } }, "featureTypes": [ "TABLES", "FORMS" ], "humanLoopConfig": { "dataAttributes": { "contentClassifiers": [ "FreeOfPersonallyIdentifiableInformation" ] }, "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanLoopName": "humnan-loop-name" } }, "aiServiceResponse": { "blocks": [...], "documentMetadata": { "pages": 1 } }, "humanTaskActivationConditionResults": { "Conditions": [ { "EvaluationResult": true, "Or": [ { "ConditionParameters": { "ImportantFormKey": "Mail address", "ImportantFormKeyAliases": [ "Mail Address:", "Mail address:", "Mailing Add:", "Mailing Addresses" ], "KeyValueBlockConfidenceLessThan": 100, "WordBlockConfidenceLessThan": 100 }, "ConditionType": "ImportantFormKeyConfidenceCheck", "EvaluationResult": true }, { "ConditionParameters": { "ImportantFormKey": "Mail address", "ImportantFormKeyAliases": [ "Mail Address:", "Mail address:", "Mailing Add:", "Mailing Addresses" ] }, "ConditionType": "MissingImportantFormKey", "EvaluationResult": false } ] } ] }, "selectedAiServiceResponse": { "blocks": [...] } } }
Amazon Rekognition Task Type Output Data

Quando usi l'integrazione integrata di Amazon Textract, vedi la stringa 'AWS/Rekognition/DetectModerationLabels/Image/V3' come valore per awsManagedHumanLoopRequestSource nei tuoi dati di output.

Il parametro answerContent contiene un oggetto moderationLabels che contiene le risposte umane per tutte le etichette di moderazione inviate ad Amazon A2I.

Il parametro aiServiceResponse include anche un oggetto moderationLabels con la risposta di Amazon Rekognition alla richiesta originale inviata a DetectModerationLabels.

Per ulteriori informazioni sui parametri che vedi nell'oggetto blocco, consulta la Amazon ModerationLabelRekognition Developer Guide.

Di seguito è riportato un esempio dei dati di output di una revisione umana di Amazon A2I delle inferenze di moderazione dell’immagine Amazon Rekognition.

{ "awsManagedHumanLoopRequestSource": "AWS/Rekognition/DetectModerationLabels/Image/V3", "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanAnswers": [ { "answerContent": { "AWS/Rekognition/DetectModerationLabels/Image/V3": { "moderationLabels": [...] } }, "submissionTime": "2020-09-28T19:22:35.508Z", "workerId": "ef7294f850a3d9d1", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111", "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333" } } } ], "humanLoopName": "humnan-loop-name", "inputContent": { "aiServiceRequest": { "humanLoopConfig": { "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanLoopName": "humnan-loop-name" }, "image": { "s3Object": { "bucket": "amzn-s3-demo-bucket1", "name": "example-image.jpg" } } }, "aiServiceResponse": { "moderationLabels": [...], "moderationModelVersion": "3.0" }, "humanTaskActivationConditionResults": { "Conditions": [ { "EvaluationResult": true, "Or": [ { "ConditionParameters": { "ConfidenceLessThan": 98, "ModerationLabelName": "Suggestive" }, "ConditionType": "ModerationLabelConfidenceCheck", "EvaluationResult": true }, { "ConditionParameters": { "ConfidenceGreaterThan": 98, "ModerationLabelName": "Female Swimwear Or Underwear" }, "ConditionType": "ModerationLabelConfidenceCheck", "EvaluationResult": false } ] } ] }, "selectedAiServiceResponse": { "moderationLabels": [ { "confidence": 96.7122802734375, "name": "Suggestive", "parentName": "" } ], "moderationModelVersion": "3.0" } } }

Dati di output da tipi di attività personalizzati

Quando aggiungi Amazon A2I a un flusso di lavoro personalizzato di revisione umana, vedi i seguenti parametri nei dati di output restituiti dalle attività di revisione umana.

Parametro Tipo di valore Descrizione

flowDefinitionArn

Stringa

L'Amazon Resource Number (ARN) del flusso di lavoro di revisione umana (definizione del flusso) utilizzato per creare il ciclo umano.

humanAnswers

Elenco di JSON oggetti

Un elenco di JSON oggetti che contengono le risposte dei lavoratori inanswerContent. Il valore di questo parametro è determinato dall'output ricevuto dal modello di attività del worker.

Se si utilizza una forza lavoro privata, sono inclusi i metadati dei worker. Per ulteriori informazioni, consulta Monitorare l'attività worker.

humanLoopName

Stringa Il nome del ciclo umano.

inputContent

JSONOggetto

Il contenuto di input inviato ad Amazon A2I nella richiesta a StartHumanLoop.

Di seguito è riportato un esempio di dati di output da un'integrazione personalizzata con Amazon A2I e Amazon Transcribe. In questo esempio, inputContent è composto da:

  • Un percorso per un file.mp4 in Amazon S3 e il titolo del video

  • La trascrizione restituita da Amazon Transcribe (analizzata dai dati di output di Amazon Transcribe)

  • Un'ora di inizio e di fine utilizzata dal modello di attività del worker per ritagliare il file .mp4 e mostrare ai worker una parte pertinente del video

{ "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanAnswers": [ { "answerContent": { "transcription": "use lambda to turn your notebook" }, "submissionTime": "2020-06-18T17:08:26.246Z", "workerId": "ef7294f850a3d9d1", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111", "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333" } } } ], "humanLoopName": "human-loop-name", "inputContent": { "audioPath": "s3://amzn-s3-demo-bucket1/a2i_transcribe_demo/Fully-Managed Notebook Instances with Amazon SageMaker - a Deep Dive.mp4", "end_time": 950.27, "original_words": "but definitely use Lambda to turn your ", "start_time": 948.51, "video_title": "Fully-Managed Notebook Instances with Amazon SageMaker - a Deep Dive.mp4" } }

Monitorare l'attività worker

Amazon A2I fornisce informazioni che puoi utilizzare per tenere traccia dei singoli worker nei dati di output delle attività. Per identificare il worker che ha lavorato all'attività di revisione umana, utilizza quanto segue dai dati di output in Amazon S3:

  • acceptanceTime è l'ora in cui il worker ha accettato l'attività. Il formato di questo indicatore di data e ora è YYYY-MM-DDTHH:MM:SS.mmmZ per l'anno (YYYY), il mese (MM), il giorno (DD), l'ora (HH), il minuto (MM), il secondo (SS) e il millisecondo (mmm). La data e l'ora sono separati da una T.

  • submissionTime è l'ora in cui il worker ha inviato le proprie annotazioni utilizzando il pulsante Invia. Il formato di questo indicatore di data e ora è YYYY-MM-DDTHH:MM:SS.mmmZ per l'anno (YYYY), il mese (MM), il giorno (DD), l'ora (HH), il minuto (MM), il secondo (SS) e il millisecondo (mmm). La data e l'ora sono separati da una T.

  • timeSpentInSeconds riporta il tempo totale, in secondi, durante il quale un worker ha lavorato attivamente su quell'attività. Questo parametro non include il tempo in cui un worker si è fermato o si è preso una pausa.

  • workerId è univoco per ogni worker.

  • Se utilizzi una forza lavoro privata, in workerMetadata, vedrai quanto segue.

    • identityProviderType è il servizio utilizzato per gestire la forza lavoro privata.

    • issuerSi tratta del pool di utenti di Amazon Cognito o dell'emittente OpenID Connect (OIDC) Identity Provider (IdP) associato al team di lavoro assegnato a questa attività di revisione umana.

    • Un identificatore sub univoco che fa riferimento al worker. Se crei una forza lavoro utilizzando Amazon Cognito, puoi recuperare i dettagli su questo worker (come il nome o il nome utente) associati a questo ID utilizzando Amazon Cognito. Per informazioni, consulta Gestione e ricerca di account utente nella Guida per gli sviluppatori di Amazon Cognito.

Di seguito è riportato un esempio dell'output che potresti visualizzare se utilizzi Amazon Cognito per creare una forza lavoro privata. Questo è identificato in identityProviderType.

"submissionTime": "2020-12-28T18:59:58.321Z", "acceptanceTime": "2020-12-28T18:59:15.191Z", "timeSpentInSeconds": 40.543, "workerId": "a12b3cdefg4h5i67", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.aws-region.amazonaws.com/aws-region_123456789", "sub": "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee" } }

Di seguito è riportato un esempio dell'output che potresti vedere se utilizzi il tuo OIDC IdP per creare una forza lavoro privata:

"workerMetadata": { "identityData": { "identityProviderType": "Oidc", "issuer": "https://example-oidc-ipd.com/adfs", "sub": "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee" } }

Per ulteriori informazioni sull’uso della forza lavoro privata, consulta Forza lavoro privata.