Amazon A2I Ausgabedaten - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon A2I Ausgabedaten

Wenn Ihr Workflow für Machine Learning Amazon A2I ein Datenobjekt sendet, wird eine Human Loop erstellt, und menschliche Prüfer erhalten die Aufgabe, dieses Datenobjekt zu überprüfen. Die Ausgabedaten jeder menschlichen Review-Aufgabe werden im Amazon Simple Storage Service (Amazon S3)-Ausgabe-Bucket gespeichert, den Sie in Ihrer Worker-Überprüfungsebene angeben. Der Pfad zu den Daten verwendet das folgende Muster, wobei YYYY/MM/DD/hh/mm/ss das Erstellungsdatum der Human Loop in der Form Jahr (YYYY), Monat (MM) und Tag (DD) und die Erstellungszeit in der Form Stunde (hh), Minute (mm) und Sekunde (ss) darstellt.

s3://customer-output-bucket-specified-in-flow-definition/flow-definition-name/YYYY/MM/DD/hh/mm/ss/human-loop-name/output.json

Der Inhalt Ihrer Ausgabedaten hängt von der Art des Aufgabentyps (integriert oder benutzerdefiniert) und der Art der Arbeitskraft ab, die Sie einsetzen. Ihre Ausgabedaten beinhalten immer die Antwort des menschlichen Arbeiters. Darüber hinaus können die Ausgabedaten Metadaten über den menschlichen Kreislauf, den menschlichen Prüfer (Worker) und das Datenobjekt enthalten.

In den folgenden Abschnitten erfahren Sie mehr über das Amazon-A2I-Ausgabedatenformat für verschiedene Aufgabentypen und Belegschaften.

Daten aus integrierten Aufgabentypen ausgeben

Zu den integrierten Aufgabentypen von Amazon A2I gehören Amazon Textract und Amazon Rekognition. Zusätzlich zu den menschlichen Antworten enthalten die Ausgabedaten einer dieser Aufgaben Details über den Grund, warum die Human Loop erstellt wurde, und Informationen über den integrierten Dienst, der zur Erstellung der menschlichen Schleife verwendet wurde. In der folgenden Tabelle erfahren Sie mehr über das Ausgabedatenschema für alle integrierten Aufgabentypen. Der Wert für jeden dieser Parameter hängt von dem Service ab, den Sie mit Amazon A2I verwenden. Weitere Informationen zu diesen servicespezifischen Werten finden Sie in der zweiten Tabelle in diesem Abschnitt.

Parameter Wert-Typ Beispielwerte Beschreibung
awsManagedHumanLoopRequestSource

String

AWS/Rekognition/DetectModerationLabels/Image/V3 oder AWS/Textract/AnalyzeDocument/Forms/V1 Der API Betrieb und die damit verbundenen AWS Dienste, bei denen Amazon A2I angefordert wurde, eine menschliche Schleife zu erstellen. Mit diesem API Vorgang konfigurieren Sie Ihren Amazon A2I Human Loop.
flowDefinitionArn

String

arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name

Die Amazon-Ressourcennummer (ARN) des Workflows zur Überprüfung durch einen Mitarbeiter (Ablaufdefinition), der zur Erstellung des Human Loop verwendet wurde.

humanAnswers

Liste der JSON Objekte

{ "answerContent": { "AWS/Rekognition/DetectModerationLabels/Image/V3": { "moderationLabels": [...] } },
or
{ "answerContent": { "AWS/Textract/AnalyzeDocument/Forms/V1": { "blocks": [...] } },
Eine Liste von JSON Objekten, die Antworten von Mitarbeitern enthaltenanswerContent.

Dieses Objekt enthält auch Einreichungsdetails und, falls private Arbeitskräfte eingesetzt wurden, Metadaten der Mitarbeiter. Weitere Informationen hierzu finden Sie unter Worker-Aktivitäten verfolgen.

Bei Human-Loop-Output-Daten, die im Rahmen von Amazon Rekognition DetectModerationLabel-Überprüfungsaufgaben generiert wurden, enthält dieser Parameter nur positive Antworten. Wenn Mitarbeiter beispielsweise Kein Inhalt auswählen, ist diese Antwort nicht enthalten.

humanLoopName

String

'human-loop-name'

Der Name der menschliche (Human Loop).
inputContent

JSONObjekt

{ "aiServiceRequest": {...}, "aiServiceResponse": {...}, "humanTaskActivationConditionResults": {...}, "selectedAiServiceResponse": {...} }

Der Eingabeinhalt, den der AWS Service an Amazon A2I gesendet hat, als er die Erstellung einer menschlichen Schleife angefordert hat.

aiServiceRequest

JSONObjekt

{ "document": {...}, "featureTypes": [...], "humanLoopConfig": {...} }
or
{ "image": {...}, "humanLoopConfig": {...} }

Die ursprüngliche Anfrage, die an den in Amazon A2I integrierten AWS Service gesendet wurde. Wenn Sie beispielsweise Amazon Rekognition mit Amazon A2I verwenden, schließt dies die im Rahmen des Vorgangs gestellte Anfrage ein. API DetectModerationLabels Bei Amazon-Textract-Integrationen schließt dies die Anfrage ein, die über AnalyzeDocument gestellt wurde.

aiServiceResponse

JSONObjekt

{ "moderationLabels": [...], "moderationModelVersion": "3.0" }

or

{ "blocks": [...], "documentMetadata": {} }

Die vollständige Antwort des AWS Dienstes. Anhand dieser Daten wird festgestellt, ob eine Überprüfung durch einen Menschen erforderlich ist. Dieses Objekt kann Metadaten über das Datenobjekt enthalten, die nicht an menschliche Prüfer weitergegeben werden.

selectedAiServiceResponse

JSONObjekt

{ "moderationLabels": [...], "moderationModelVersion": "3.0" }

or

{ "blocks": [...], "documentMetadata": {} }

Die Teilmenge von aiServiceResponse, die den Aktivierungsbedingungen in ActivationConditions entspricht.

Alle in aiServiceResponse aufgelisteten Datenobjekte werden in selectedAiServiceResponse aufgelistet, wenn die Schlussfolgerungen nach dem Zufallsprinzip gezogen werden oder alle Schlussfolgerungen Aktivierungsbedingungen auslösen.

humanTaskActivationConditionResults

JSONObjekt

{ "Conditions": [...] }

Ein JSON ObjektinputContent, das den Grund für die Entstehung einer menschlichen Schleife enthält. Dazu gehören eine Liste der Aktivierungsbedingungen (Conditions), die in Ihrem Workflow für die menschliche Überprüfung (Ablaufdefinition) enthalten sind, sowie das Bewertungsergebnis für jede Bedingung – dieses Ergebnis ist entweder true oder false. Weitere Informationen zu den Aktivierungsbedingungen finden Sie unter JSONSchema für die Aktivierungsbedingungen von Human Loop in Amazon Augmented AI.

Wählen Sie in der folgenden Tabelle eine Registerkarte aus, um mehr über die für den Tasktyp spezifischen Parameter zu erfahren und sich ein Beispiel für einen Codeblock mit Ausgabedaten für jeden der integrierten Tasktypen anzusehen.

Amazon Textract Task Type Output Data

Wenn Sie die integrierte Amazon-Textract-Integration verwenden, sehen Sie 'AWS/Textract/AnalyzeDocument/Forms/V1' als den Wert für awsManagedHumanLoopRequestSource in Ihren Ausgabedaten.

Der answerContent Parameter enthält ein Block Objekt, das menschliche Antworten für alle an Amazon A2I gesendeten Blöcke enthält.

Der aiServiceResponse Parameter beinhaltet auch ein Block Objekt mit der Antwort von Amazon Textract auf die ursprüngliche Anfrage, die mit an AnalyzeDocument gesendet wurde.

Weitere Informationen zu den Parametern, die Sie im Blockobjekt sehen, finden Sie unter Block im Amazon Textract Developer Guide.

Im Folgenden finden Sie ein Beispiel für die Ausgabedaten einer Amazon-A2I-Überprüfung der Schlussfolgerungen aus der Amazon-Textract-Dokumentenanalyse durch einen Menschen.

{ "awsManagedHumanLoopRequestSource": "AWS/Textract/AnalyzeDocument/Forms/V1", "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanAnswers": [ { "answerContent": { "AWS/Textract/AnalyzeDocument/Forms/V1": { "blocks": [...] } }, "submissionTime": "2020-09-28T19:17:59.880Z", "workerId": "111122223333", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111", "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333" } } } ], "humanLoopName": "humnan-loop-name", "inputContent": { "aiServiceRequest": { "document": { "s3Object": { "bucket": "amzn-s3-demo-bucket1", "name": "document-demo.jpg" } }, "featureTypes": [ "TABLES", "FORMS" ], "humanLoopConfig": { "dataAttributes": { "contentClassifiers": [ "FreeOfPersonallyIdentifiableInformation" ] }, "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanLoopName": "humnan-loop-name" } }, "aiServiceResponse": { "blocks": [...], "documentMetadata": { "pages": 1 } }, "humanTaskActivationConditionResults": { "Conditions": [ { "EvaluationResult": true, "Or": [ { "ConditionParameters": { "ImportantFormKey": "Mail address", "ImportantFormKeyAliases": [ "Mail Address:", "Mail address:", "Mailing Add:", "Mailing Addresses" ], "KeyValueBlockConfidenceLessThan": 100, "WordBlockConfidenceLessThan": 100 }, "ConditionType": "ImportantFormKeyConfidenceCheck", "EvaluationResult": true }, { "ConditionParameters": { "ImportantFormKey": "Mail address", "ImportantFormKeyAliases": [ "Mail Address:", "Mail address:", "Mailing Add:", "Mailing Addresses" ] }, "ConditionType": "MissingImportantFormKey", "EvaluationResult": false } ] } ] }, "selectedAiServiceResponse": { "blocks": [...] } } }
Amazon Rekognition Task Type Output Data

Wenn Sie die integrierte Amazon-Textract-Integration verwenden, sehen Sie die Zeichenfolge 'AWS/Rekognition/DetectModerationLabels/Image/V3' als Wert für awsManagedHumanLoopRequestSource in Ihren Ausgabedaten.

Der answerContent Parameter enthält ein moderationLabels Objekt, das menschliche Antworten für alle Moderationslabels enthält, die an Amazon A2I gesendet wurden.

Der aiServiceResponse Parameter beinhaltet auch ein moderationLabels Objekt mit der Antwort von Amazon Rekognition auf die ursprüngliche Anfrage, an die DetectModerationLabels gesendet wurde.

Weitere Informationen zu den Parametern, die Sie im Blockobjekt sehen, finden Sie ModerationLabelim Amazon Rekognition Developer Guide.

Im Folgenden finden Sie ein Beispiel für die Ausgabedaten einer Amazon-A2I-Überprüfung der Amazon Rekognition Image-Moderation-Inferenzen durch einen Menschen.

{ "awsManagedHumanLoopRequestSource": "AWS/Rekognition/DetectModerationLabels/Image/V3", "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanAnswers": [ { "answerContent": { "AWS/Rekognition/DetectModerationLabels/Image/V3": { "moderationLabels": [...] } }, "submissionTime": "2020-09-28T19:22:35.508Z", "workerId": "ef7294f850a3d9d1", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111", "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333" } } } ], "humanLoopName": "humnan-loop-name", "inputContent": { "aiServiceRequest": { "humanLoopConfig": { "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanLoopName": "humnan-loop-name" }, "image": { "s3Object": { "bucket": "amzn-s3-demo-bucket1", "name": "example-image.jpg" } } }, "aiServiceResponse": { "moderationLabels": [...], "moderationModelVersion": "3.0" }, "humanTaskActivationConditionResults": { "Conditions": [ { "EvaluationResult": true, "Or": [ { "ConditionParameters": { "ConfidenceLessThan": 98, "ModerationLabelName": "Suggestive" }, "ConditionType": "ModerationLabelConfidenceCheck", "EvaluationResult": true }, { "ConditionParameters": { "ConfidenceGreaterThan": 98, "ModerationLabelName": "Female Swimwear Or Underwear" }, "ConditionType": "ModerationLabelConfidenceCheck", "EvaluationResult": false } ] } ] }, "selectedAiServiceResponse": { "moderationLabels": [ { "confidence": 96.7122802734375, "name": "Suggestive", "parentName": "" } ], "moderationModelVersion": "3.0" } } }

Daten aus benutzerdefinierten Aufgabentypen ausgeben

Wenn Sie Amazon A2I zu einem benutzerdefinierten Arbeitsablauf für die Überprüfung durch einen Mitarbeiter hinzufügen, sehen Sie die folgenden Parameter in den Ausgabedaten, die von menschlichen Überprüfungsaufgaben zurückgegeben werden.

Parameter Wert-Typ Beschreibung

flowDefinitionArn

String

Die Amazon-Ressourcennummer (ARN) des Workflows zur Überprüfung durch einen Mitarbeiter (Ablaufdefinition), der zur Erstellung des Human Loop verwendet wurde.

humanAnswers

Liste der JSON Objekte

Eine Liste von JSON Objekten, die Antworten von Mitarbeitern enthaltenanswerContent. Der Wert in diesem Parameter wird durch die Ausgabe bestimmt, die Sie von Ihrer Worker-Aufgabenvorlage erhalten haben.

Wenn Sie eine private Belegschaft einsetzen, sind die Metadaten der Mitarbeiter enthalten. Weitere Informationen hierzu finden Sie unter Worker-Aktivitäten verfolgen.

humanLoopName

String Der Name der menschliche (Human Loop).

inputContent

JSONObjekt

Der an Amazon A2I gesendete Eingabeinhalt ist in der Anfrage an StartHumanLoop enthalten.

Im Folgenden finden Sie ein Beispiel für Ausgabedaten aus einer benutzerdefinierten Integration mit Amazon A2I und Amazon Transcribe. In diesem Beispiel besteht der inputContent aus:

  • Ein Pfad zu einer.mp4-Datei in Amazon S3 und der Videotitel

  • Die von Amazon Transcribe zurückgesendete Transkription (analysiert aus den Amazon Transcribe-Ausgabedaten)

  • Eine Start- und Endzeit, die von der Worker-Aufgabenvorlage verwendet wird, um die MP4-Datei auszuschneiden und den Arbeitern einen relevanten Teil des Videos zu zeigen

{ "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "humanAnswers": [ { "answerContent": { "transcription": "use lambda to turn your notebook" }, "submissionTime": "2020-06-18T17:08:26.246Z", "workerId": "ef7294f850a3d9d1", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111", "sub": "c6aa8eb7-9944-42e9-a6b9-111122223333" } } } ], "humanLoopName": "human-loop-name", "inputContent": { "audioPath": "s3://amzn-s3-demo-bucket1/a2i_transcribe_demo/Fully-Managed Notebook Instances with Amazon SageMaker - a Deep Dive.mp4", "end_time": 950.27, "original_words": "but definitely use Lambda to turn your ", "start_time": 948.51, "video_title": "Fully-Managed Notebook Instances with Amazon SageMaker - a Deep Dive.mp4" } }

Worker-Aktivitäten verfolgen

Amazon A2I bietet Informationen, mit denen Sie einzelne Mitarbeiter anhand von Aufgabenausgabedaten verfolgen können. Um den Mitarbeiter zu identifizieren, der an der menschlichen Überprüfungsaufgabe gearbeitet hat, verwenden Sie Folgendes aus den Ausgabedaten in Amazon S3:

  • Der acceptanceTime ist die Zeit, zu welcher der Mitarbeiter die Aufgabe angenommen hat. Das Format dieses Datums- und Zeitstempels bezieht sich YYYY-MM-DDTHH:MM:SS.mmmZ auf Jahr (YYYY), Monat (MM), Tag (DD), Stunde (HH), Minute (MM), Sekunde (SS) und Millisekunde (). mmm Datum und Uhrzeit werden durch ein T getrennt.

  • Der submissionTime ist die Zeit, zu der die Arbeitskraft ihre Anmerkungen mit der Schaltfläche Senden eingereicht hat. Das Format dieses Datums- und Zeitstempels YYYY-MM-DDTHH:MM:SS.mmmZ bezieht sich auf Jahr (YYYY), Monat (MM), Tag (DD), Stunde (HH), Minute (MM), Sekunde (SS) und Millisekunde (). mmm Datum und Uhrzeit werden durch ein T getrennt.

  • timeSpentInSeconds gibt die Gesamtzeit in Sekunden an, die ein Auftragnehmer aktiv an dieser Aufgabe gearbeitet hat. Diese Metrik beinhaltet nicht die Zeit, in der ein Auftragnehmer die Arbeit unterbrochen oder eine Pause gemacht hat.

  • Die workerId ist für jeden Worker spezifisch.

  • Wenn Sie private Arbeitskräfte verwenden, wird in workerMetadata Folgendes angezeigt.

    • identityProviderType ist der Dienst, der für die Verwaltung der privaten Arbeitskräfte zuständig ist.

    • Das issuer ist der Amazon Cognito Cognito-Benutzerpool oder der OpenID Connect (OIDC) Identity Provider (IdP) -Aussteller, der dem Arbeitsteam zugeordnet ist, das mit dieser menschlichen Überprüfungsaufgabe beauftragt ist.

    • Ein eindeutiger sub-Identifier verweist auf den Arbeitnehmer. Wenn Sie mit Amazon Cognito eine Belegschaft erstellen, können Sie mit Amazon Cognito Details zu dieser Arbeitskraft (wie den Namen oder den Benutzernamen) abrufen, die dieser ID zugeordnet sind. Wie das funktioniert, erfahren Sie unter Verwalten und Suchen von Benutzerkonten im Amazon Cognito Developer Guide.

Im Folgenden finden Sie ein Beispiel für die Ausgabe, die Sie sehen können, wenn Sie Amazon Cognito verwenden, um private Arbeitskräfte zu erstellen. Dies ist in der identityProviderType identifiziert.

"submissionTime": "2020-12-28T18:59:58.321Z", "acceptanceTime": "2020-12-28T18:59:15.191Z", "timeSpentInSeconds": 40.543, "workerId": "a12b3cdefg4h5i67", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.aws-region.amazonaws.com/aws-region_123456789", "sub": "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee" } }

Das Folgende ist ein Beispiel für die Ausgabe, die Sie sehen können, wenn Sie Ihren eigenen OIDC IdP verwenden, um eine private Belegschaft aufzubauen:

"workerMetadata": { "identityData": { "identityProviderType": "Oidc", "issuer": "https://example-oidc-ipd.com/adfs", "sub": "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee" } }

Weitere Informationen zum Einsetzen von privaten Arbeitskräften finden Sie unter Private Arbeitskräfte.