Dati di output dai tipi di Built-In attività Dati di output da tipi di attività personalizzati Monitorare l'attività worker

Dati di output di Amazon A2I

Quando il flusso di lavoro di machine learning invia ad Amazon A2I un oggetto di dati, viene creato un ciclo umano e i revisori umani ricevono un’attività per esaminare quell'oggetto di dati. I dati in output da ogni attività di revisione umana vengono archiviati nel bucket output Amazon Simple Storage Service (Amazon S3) specificato nel flusso di lavoro di revisione umana. Nel percorso dei dati, YYYY/MM/DD/hh/mm/ss rappresenta la data di creazione del ciclo umano con anno (YYYY), mese (MM) e giorno (DD) e l’ora di creazione con ora (hh), minute (mm) e secondi (ss).


s3://customer-output-bucket-specified-in-flow-definition/flow-definition-name/YYYY/MM/DD/hh/mm/ss/human-loop-name/output.json

Il contenuto dei dati di output dipende dal tipo di attività (integrata o personalizzata) e dal tipo di forza lavoro utilizzata. I dati di output includono sempre la risposta del worker umano. Inoltre, i dati di output possono includere metadati relativi al ciclo umano, al revisore umano (worker) e all'oggetto dei dati.

Utilizza le seguenti sezioni per saperne di più sul formato dei dati di output di Amazon A2I per diversi tipi di attività e forze di lavoro.

Dati di output dai tipi di Built-In attività

I tipi di attività predefiniti di Amazon A2I includono Amazon Textract e Amazon Rekognition. Oltre alle risposte umane, i dati di output di una di queste attività includono dettagli sul motivo per cui è stato creato il ciclo umano e informazioni sul servizio integrato utilizzato per creare il ciclo umano. Utilizza la tabella seguente per ulteriori informazioni sullo schema dei dati di output per tutti i tipi di attività predefiniti. Il valore per ciascuno di questi parametri dipende dal servizio utilizzato con Amazon A2I. Consulta la seconda tabella di questa sezione per ulteriori informazioni su questi valori specifici del servizio.

Parametro	Tipo di valore	Valori di esempio	Description
`awsManagedHumanLoopRequestSource`	Stringa	`AWS/Rekognition/DetectModerationLabels/Image/V3` o `AWS/Textract/AnalyzeDocument/Forms/V1`	L'operazione dell'API e AWS i servizi associati che hanno richiesto che Amazon A2I creasse un loop umano. Questa è l'operazione API che usi per configurare il tuo ciclo umano di Amazon A2I.
`flowDefinitionArn`	Stringa	`arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name`	L'Amazon Resource Number (ARN) del flusso di lavoro di revisione umana (definizione flusso) utilizzato per creare il ciclo umano.
`humanAnswers`	Elenco degli oggetti JSON	`{ "answerContent": { "AWS/Rekognition/DetectModerationLabels/Image/V3": { "moderationLabels": [...] } },` or `{ "answerContent": { "AWS/Textract/AnalyzeDocument/Forms/V1": { "blocks": [...] } },`	Un elenco di oggetti JSON che contengono le risposte dei worker in `answerContent`. Questo oggetto contiene anche i dettagli dell'invio e, se è stata utilizzata una forza lavoro privata, i metadati dei worker. Per ulteriori informazioni, consulta Monitorare l'attività worker. Per i dati di output del ciclo umano prodotti dalle attività di revisione di `DetectModerationLabel` Amazon Rekognition, questo parametro contiene solo risposte positive. Ad esempio, se i worker selezionano Nessun contenuto, questa risposta non viene inclusa.
`humanLoopName`	Stringa	`'human-loop-name'`	Il nome del ciclo umano.
`inputContent`	Oggetto JSON	`{ "aiServiceRequest": {...}, "aiServiceResponse": {...}, "humanTaskActivationConditionResults": {...}, "selectedAiServiceResponse": {...} }`	Il contenuto di input che il AWS servizio ha inviato ad Amazon A2I quando ha richiesto la creazione di un loop umano.
`aiServiceRequest`	Oggetto JSON	`{ "document": {...}, "featureTypes": [...], "humanLoopConfig": {...} }` or `{ "image": {...}, "humanLoopConfig": {...} }`	La richiesta originale inviata al AWS servizio integrato con Amazon A2I. Ad esempio, se utilizzi Amazon Rekognition con Amazon A2I, ciò include la richiesta effettuata tramite l'operazione API `DetectModerationLabels`. Per le integrazioni Amazon Textract, ciò include la richiesta effettuata tramite `AnalyzeDocument`.
`aiServiceResponse`	Oggetto JSON	`{ "moderationLabels": [...], "moderationModelVersion": "3.0" }` or `{ "blocks": [...], "documentMetadata": {} }`	La risposta completa del AWS servizio. Si tratta dei dati utilizzati per determinare se è necessaria una revisione umana. Questo oggetto può contenere metadati sull'oggetto dati che non sono condivisi con revisori umani.
`selectedAiServiceResponse`	Oggetto JSON	`{ "moderationLabels": [...], "moderationModelVersion": "3.0" }` or `{ "blocks": [...], "documentMetadata": {} }`	Il sottoinsieme di `aiServiceResponse` che corrisponde alle condizioni di attivazione in `ActivationConditions`. Tutti gli oggetti dati elencati in `aiServiceResponse` sono elencati nelle condizioni di attivazione `selectedAiServiceResponse` quando le inferenze vengono campionate casualmente o tutte le inferenze avviano le condizioni di attivazione.
`humanTaskActivationConditionResults`	Oggetto JSON	`{ "Conditions": [...] }`	Un oggetto JSON `inputContent` che contiene il motivo per cui è stato creato un cico umano. Ciò include un elenco delle condizioni di attivazione (`Conditions`) incluse nel flusso di lavoro di revisione umana (definizione del flusso) e il risultato della valutazione per ciascuna condizione: questo risultato è `true` o `false`. Per maggiori informazioni sui termini di attivazione, consulta Schema JSON per condizioni attivazione del ciclo umano in IA aumentata Amazon.

Seleziona una scheda nella tabella seguente per informazioni sui parametri specifici del tipo di attività e visualizza un esempio di blocco di codice dei dati di output per ciascuno dei tipi di attività predefiniti.

Amazon Textract Task Type Output Data

Quando usi l'integrazione integrata di Amazon Textract, vedi 'AWS/Textract/AnalyzeDocument/Forms/V1' come valore per awsManagedHumanLoopRequestSource nei tuoi dati di output.

Il parametro answerContent contiene un oggetto Block che include le risposte umane per tutti i blocchi inviati ad Amazon A2I.

Il parametro aiServiceResponse include anche un oggetto Block con la risposta di Amazon Textract alla richiesta originale inviata tramite AnalyzeDocument.

Per ulteriori informazioni sui parametri che vedi nell'oggetto blocco, consulta Blocco nella Guida per gli sviluppatori Amazon Textract.

Di seguito è riportato un esempio dei dati di output di una revisione umana di Amazon A2I delle inferenze dell'analisi dei documenti di Amazon Textract.


{
    "awsManagedHumanLoopRequestSource": "AWS/Textract/AnalyzeDocument/Forms/V1",
    "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name",
    "humanAnswers": [
        {
            "answerContent": {
                "AWS/Textract/AnalyzeDocument/Forms/V1": {
                    "blocks": [...]
                }
            },
            "submissionTime": "2020-09-28T19:17:59.880Z",
            "workerId": "111122223333",
            "workerMetadata": {
                "identityData": {
                    "identityProviderType": "Cognito",
                    "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111",
                    "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333"
                }
            }
        }
    ],
    "humanLoopName": "humnan-loop-name",
    "inputContent": {
        "aiServiceRequest": {
            "document": {
                "s3Object": {
                    "bucket": "amzn-s3-demo-bucket1",
                    "name": "document-demo.jpg"
                }
            },
            "featureTypes": [
                "TABLES",
                "FORMS"
            ],
            "humanLoopConfig": {
                "dataAttributes": {
                    "contentClassifiers": [
                        "FreeOfPersonallyIdentifiableInformation"
                    ]
                },
                "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name",
                "humanLoopName": "humnan-loop-name"
            }
        },
        "aiServiceResponse": {
            "blocks": [...],
            "documentMetadata": {
                "pages": 1
            }
        },
        "humanTaskActivationConditionResults": {
            "Conditions": [
                {
                    "EvaluationResult": true,
                    "Or": [
                        {
                            "ConditionParameters": {
                                "ImportantFormKey": "Mail address",
                                "ImportantFormKeyAliases": [
                                    "Mail Address:",
                                    "Mail address:",
                                    "Mailing Add:",
                                    "Mailing Addresses"
                                ],
                                "KeyValueBlockConfidenceLessThan": 100,
                                "WordBlockConfidenceLessThan": 100
                            },
                            "ConditionType": "ImportantFormKeyConfidenceCheck",
                            "EvaluationResult": true
                        },
                        {
                            "ConditionParameters": {
                                "ImportantFormKey": "Mail address",
                                "ImportantFormKeyAliases": [
                                    "Mail Address:",
                                    "Mail address:",
                                    "Mailing Add:",
                                    "Mailing Addresses"
                                ]
                            },
                            "ConditionType": "MissingImportantFormKey",
                            "EvaluationResult": false
                        }
                    ]
                }
            ]
        },
        "selectedAiServiceResponse": {
            "blocks": [...]
        }
    }
}

Amazon Rekognition Task Type Output Data

Quando usi l'integrazione integrata di Amazon Textract, vedi la stringa 'AWS/Rekognition/DetectModerationLabels/Image/V3' come valore per awsManagedHumanLoopRequestSource nei tuoi dati di output.

Il parametro answerContent contiene un oggetto moderationLabels che contiene le risposte umane per tutte le etichette di moderazione inviate ad Amazon A2I.

Il parametro aiServiceResponse include anche un oggetto moderationLabels con la risposta di Amazon Rekognition alla richiesta originale inviata a DetectModerationLabels.

Per ulteriori informazioni sui parametri che vedi nell'oggetto blocco, consulta la Amazon ModerationLabelRekognition Developer Guide.

Di seguito è riportato un esempio dei dati di output di una revisione umana di Amazon A2I delle inferenze di moderazione dell’immagine Amazon Rekognition.


{
    "awsManagedHumanLoopRequestSource": "AWS/Rekognition/DetectModerationLabels/Image/V3",
    "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name",
    "humanAnswers": [
        {
            "answerContent": {
                "AWS/Rekognition/DetectModerationLabels/Image/V3": {
                    "moderationLabels": [...]
                }
            },
            "submissionTime": "2020-09-28T19:22:35.508Z",
            "workerId": "ef7294f850a3d9d1",
            "workerMetadata": {
                "identityData": {
                    "identityProviderType": "Cognito",
                    "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111",
                    "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333"
                }
            }
        }
    ],
    "humanLoopName": "humnan-loop-name",
    "inputContent": {
        "aiServiceRequest": {
            "humanLoopConfig": {
                "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name",
                "humanLoopName": "humnan-loop-name"
            },
            "image": {
                "s3Object": {
                    "bucket": "amzn-s3-demo-bucket1",
                    "name": "example-image.jpg"
                }
            }
        },
        "aiServiceResponse": {
            "moderationLabels": [...],
            "moderationModelVersion": "3.0"
        },
        "humanTaskActivationConditionResults": {
            "Conditions": [
                {
                    "EvaluationResult": true,
                    "Or": [
                        {
                            "ConditionParameters": {
                                "ConfidenceLessThan": 98,
                                "ModerationLabelName": "Suggestive"
                            },
                            "ConditionType": "ModerationLabelConfidenceCheck",
                            "EvaluationResult": true
                        },
                        {
                            "ConditionParameters": {
                                "ConfidenceGreaterThan": 98,
                                "ModerationLabelName": "Female Swimwear Or Underwear"
                            },
                            "ConditionType": "ModerationLabelConfidenceCheck",
                            "EvaluationResult": false
                        }
                    ]
                }
            ]
        },
        "selectedAiServiceResponse": {
            "moderationLabels": [
                {
                    "confidence": 96.7122802734375,
                    "name": "Suggestive",
                    "parentName": ""
                }
            ],
            "moderationModelVersion": "3.0"
        }
    }
}

Dati di output da tipi di attività personalizzati

Quando aggiungi Amazon A2I a un flusso di lavoro personalizzato di revisione umana, vedi i seguenti parametri nei dati di output restituiti dalle attività di revisione umana.

Parametro	Tipo di valore	Description
`flowDefinitionArn`	Stringa	L'Amazon Resource Number (ARN) del flusso di lavoro di revisione umana (definizione flusso) utilizzato per creare il ciclo umano.
`humanAnswers`	Elenco degli oggetti JSON	Un elenco di oggetti JSON che contengono le risposte dei worker in `answerContent`. Il valore di questo parametro è determinato dall'output ricevuto dal modello di attività del worker. Se si utilizza una forza lavoro privata, sono inclusi i metadati dei worker. Per ulteriori informazioni, consulta Monitorare l'attività worker.
`humanLoopName`	Stringa	Il nome del ciclo umano.
`inputContent`	Oggetto JSON	Il contenuto di input inviato ad Amazon A2I nella richiesta a `StartHumanLoop`.

Di seguito è riportato un esempio di dati di output da un'integrazione personalizzata con Amazon A2I e Amazon Transcribe. In questo esempio, inputContent è composto da:

Un percorso per un file.mp4 in Amazon S3 e il titolo del video
La trascrizione restituita da Amazon Transcribe (analizzata dai dati di output di Amazon Transcribe)
Un'ora di inizio e di fine utilizzata dal modello di attività del worker per ritagliare il file .mp4 e mostrare ai worker una parte pertinente del video


{
    "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name",
    "humanAnswers": [
        {
            "answerContent": {
                "transcription": "use lambda to turn your notebook"
            },
            "submissionTime": "2020-06-18T17:08:26.246Z",
            "workerId": "ef7294f850a3d9d1",
            "workerMetadata": {
                "identityData": {
                    "identityProviderType": "Cognito",
                    "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111",
                    "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333"
                }
            }

        }
    ],
    "humanLoopName": "human-loop-name",
    "inputContent": {
        "audioPath": "s3://amzn-s3-demo-bucket1/a2i_transcribe_demo/Fully-Managed Notebook Instances with Amazon SageMaker - a Deep Dive.mp4",
        "end_time": 950.27,
        "original_words": "but definitely use Lambda to turn your ",
        "start_time": 948.51,
        "video_title": "Fully-Managed Notebook Instances with Amazon SageMaker - a Deep Dive.mp4"
    }
}

Monitorare l'attività worker

Amazon A2I fornisce informazioni che puoi utilizzare per tenere traccia dei singoli worker nei dati di output delle attività. Per identificare il worker che ha lavorato all'attività di revisione umana, utilizza quanto segue dai dati di output in Amazon S3:

acceptanceTime è l'ora in cui il worker ha accettato l'attività. Il formato di questo indicatore di data e ora è YYYY-MM-DDTHH:MM:SS.mmmZ per l'anno (YYYY), il mese (MM), il giorno (DD), l'ora (HH), il minuto (MM), il secondo (SS) e il millisecondo (mmm). La data e l'ora sono separati da una T.
submissionTime è l'ora in cui il worker ha inviato le proprie annotazioni utilizzando il pulsante Invia. Il formato di questo indicatore di data e ora è YYYY-MM-DDTHH:MM:SS.mmmZ per l'anno (YYYY), il mese (MM), il giorno (DD), l'ora (HH), il minuto (MM), il secondo (SS) e il millisecondo (mmm). La data e l'ora sono separati da una T.
timeSpentInSeconds riporta il tempo totale, in secondi, durante il quale un worker ha lavorato attivamente su quell'attività. Questo parametro non include il tempo in cui un worker si è fermato o si è preso una pausa.
workerId è univoco per ogni worker.
Se utilizzi una forza lavoro privata, in workerMetadata, vedrai quanto segue.
- identityProviderType è il servizio utilizzato per gestire la forza lavoro privata.
- issuer è il pool di utenti Amazon Cognito o il gestore dell’identità digitale OpenID Connect (OIDC) dell’emittente associato al team di lavoro assegnato a questa attività di revisione umana.
- Un identificatore sub univoco che fa riferimento al worker. Se crei una forza lavoro utilizzando Amazon Cognito, puoi recuperare i dettagli su questo worker (come il nome o il nome utente) associati a questo ID utilizzando Amazon Cognito. Per informazioni, consulta Gestione e ricerca di account utente nella Guida per gli sviluppatori di Amazon Cognito.

Di seguito è riportato un esempio dell'output che potresti visualizzare se utilizzi Amazon Cognito per creare una forza lavoro privata. Questo è identificato in identityProviderType.


"submissionTime": "2020-12-28T18:59:58.321Z",
"acceptanceTime": "2020-12-28T18:59:15.191Z", 
"timeSpentInSeconds": 40.543,
"workerId": "a12b3cdefg4h5i67",
"workerMetadata": {
    "identityData": {
        "identityProviderType": "Cognito",
        "issuer": "https://cognito-idp.aws-region.amazonaws.com/aws-region_123456789",
        "sub": "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee"
    }
}

Di seguito è riportato un esempio dell'output che potresti visualizzare se utilizzi il tuo IdP OIDC per creare una forza lavoro privata:


"workerMetadata": {
        "identityData": {
            "identityProviderType": "Oidc",
            "issuer": "https://example-oidc-ipd.com/adfs",
            "sub": "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee"
        }
}

Per ulteriori informazioni sull’uso della forza lavoro privata, consulta Forza lavoro privata.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Monitoraggio e gestione del ciclo umano

Autorizzazioni e sicurezza