翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon A2I 出力データ
機械学習ワークフローが Amazon A2I にデータオブジェクトを送信すると、ヒューマンループが作成され、人間によるレビュー担当者がタスクを受け取り、そのデータオブジェクトをレビューします。各人間によるレビュータスクからの出力データは、人間によるレビューワークフローで指定した Amazon Simple Storage Service (Amazon S3) 出力バケットに保存されます。データへのパスで、
は年 (YYYY
/MM
/DD
/hh
/mm
/ss
YYYY
)、月 (MM
)、日 (DD
)、作成時刻 (hh
)、分 (mm
)、秒 (ss
) を使用してヒューマンループの作成日時を表します。
s3://
customer-output-bucket-specified-in-flow-definition
/flow-definition-name
/YYYY
/MM
/DD
/hh
/mm
/ss
/human-loop-name
/output.json
出力データの内容は、タスクタイプ (組み込みまたはカスタム) と使用するワークフォースのタイプによって異なります。出力データには、常に人間のワーカーからのレスポンスが含まれます。さらに、出力データには、ヒューマンループ、人間によるレビュー担当者 (ワーカー)、データオブジェクトに関するメタデータを含めることができます。
次のセクションでは、さまざまなタスクタイプとワークフォースの Amazon A2I 出力データ形式の詳細について説明します。
組み込みタスクタイプからの出力データ
Amazon A2I 組み込みタスクタイプには、Amazon Textract と Amazon Rekognition があります。人間によるレスポンスに加えて、これらのタスクのいずれかからの出力データには、ヒューマンループが作成された理由と、ヒューマンループの作成に使用される統合サービスに関する詳細が含まれます。次の表では、すべての組み込みタスクタイプに対する出力データスキーマの詳細について説明します。これらの各パラメータの値は、Amazon A2I で使用するサービスによって異なります。これらのサービス固有の値の詳細については、このセクションの 2 番目の表を参照してください。
パラメータ | 値の型 | 値の例 | 説明 |
---|---|---|---|
awsManagedHumanLoopRequestSource |
文字列 |
AWS/Rekognition/DetectModerationLabels/Image/V3 、または AWS/Textract/AnalyzeDocument/Forms/V1 |
Amazon A2I でのヒューマンループの作成をリクエストした API オペレーションと関連 AWS サービス。これは、Amazon A2I ヒューマンループの設定に使用する API オペレーションです。 |
flowDefinitionArn |
文字列 |
arn:aws:sagemaker:us-west-2: |
ヒューマンループの作成に使用される人間によるレビューワークフロー (フロー定義) の Amazon リソースナンバー (ARN)。 |
humanAnswers |
JSON オブジェクトのリスト |
または
|
answerContent にワーカーのレスポンスを含む JSON オブジェクトのリスト。このオブジェクトには、送信の詳細と、プライベートワークフォースが使用された場合は、ワーカーのメタデータも含まれます。詳細については、「ワーカーのアクティビティを追跡する」を参照してください。 Amazon Rekognition |
humanLoopName |
文字列 |
|
ヒューマンループの名前。 |
inputContent |
JSON オブジェクト |
|
Amazon A2I がヒューマンループの作成をリクエストすると、AWS サービスによって Amazon A2I に送信される入力コンテンツ。 |
aiServiceRequest |
JSON オブジェクト |
または
|
Amazon A2I と統合された AWS サービスに送信された元のリクエスト。例えば、Amazon Rekognition を Amazon A2I とともに使用する場合、これには API オペレーション |
aiServiceResponse |
JSON オブジェクト |
または
|
AWS サービスからの完全なレスポンス。これは、人間によるレビューが必要かどうかを判断するために使用されるデータです。このオブジェクトには、人間によるレビュー担当者と共有されていないデータオブジェクトに関するメタデータが含まれていることがあります。 |
selectedAiServiceResponse |
JSON オブジェクト |
または
|
|
humanTaskActivationConditionResults |
JSON オブジェクト |
|
ヒューマンループが作成された理由を含む |
次の表でタブを選択してタスクタイプ固有のパラメータについて確認し、組み込みの各タスクタイプに対する出力データコードブロックの例を参照してください。
カスタムタスクタイプからの出力データ
Amazon A2I をカスタムの人間によるレビューワークフローに追加すると、人間によるレビュータスクから返される出力データに次のパラメータが表示されます。
パラメータ | 値の型 | 説明 |
---|---|---|
|
文字列 |
ヒューマンループの作成に使用される人間によるレビューワークフロー (フロー定義) の Amazon リソースナンバー (ARN)。 |
|
JSON オブジェクトのリスト |
answerContent にワーカーのレスポンスを含む JSON オブジェクトのリスト。このパラメータの値は、ワーカータスクテンプレートから受信した出力によって決まります。プライベートワークフォースを使用している場合、ワーカーのメタデータが含まれます。詳細については、「ワーカーのアクティビティを追跡する」を参照してください。 |
|
文字列 | ヒューマンループの名前。 |
|
JSON オブジェクト |
|
Amazon A2I および Amazon Transcribe とのカスタム統合からの出力データの例を次に示します。この例では、inputContent
は次で構成されます。
-
Amazon S3 の .mp4 ファイルへのパスと動画のタイトル
-
Amazon Transscribe から返されたトランスクリプション (Amazon Transcribe 出力データから解析済み)
-
ワーカータスクテンプレートで .mp4 ファイルをクリップし、ワーカーが動画の関連部分の表示に使用する開始時刻と終了時刻
{ "flowDefinitionArn": "arn:aws:sagemaker:us-west-2:
111122223333
:flow-definition/flow-definition-name
", "humanAnswers": [ { "answerContent": { "transcription": "use lambda to turn your notebook" }, "submissionTime": "2020-06-18T17:08:26.246Z", "workerId": "ef7294f850a3d9d1", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.us-west-2.amazonaws.com/us-west-2_111111
", "sub": "c6aa8eb7-9944-42e9-a6b9-
" } } } ], "humanLoopName": "111122223333
human-loop-name
", "inputContent": { "audioPath": "s3://amzn-s3-demo-bucket1
/a2i_transcribe_demo/Fully-Managed Notebook Instances with Amazon SageMaker - a Deep Dive.mp4", "end_time": 950.27, "original_words": "but definitely use Lambda to turn your ", "start_time": 948.51, "video_title": "Fully-Managed Notebook Instances with Amazon SageMaker - a Deep Dive.mp4" } }
ワーカーのアクティビティを追跡する
Amazon A2I は、タスク出力データ内の個々のワーカーの追跡に使用できる情報を提供します。人間によるレビュータスクで作業したワーカーを特定するには、Amazon S3 の出力データで以下を使用します。
-
acceptanceTime
は、ワーカーがタスクを受け入れた時刻です。この日付とタイムスタンプの形式はYYYY-MM-DDTHH:MM:SS.mmmZ
で、年 (YYYY
)、月 (MM
), 日 (DD
)、時間 (HH
)、分 (MM
)、秒 (SS
)、ミリ秒 (mmm
) です。日付と時刻は T で区切られます。 -
submissionTime
は、ワーカーが [SUBMT] (送信) ボタンを使用して注釈を送信した時刻です。この日付とタイムスタンプの形式はYYYY-MM-DDTHH:MM:SS.mmmZ
で、年 (YYYY
)、月 (MM
), 日 (DD
)、時間 (HH
)、分 (MM
)、秒 (SS
)、ミリ秒 (mmm
) です。日付と時刻は T で区切られます。 -
timeSpentInSeconds
は、ワーカーがそのタスクに積極的に取り組んだ合計時間を秒単位で報告します。このメトリクスには、ワーカーが一時停止または休憩した時間は含まれません。 -
workerId
は、各ワーカーに固有です。 -
workerMetadata
でプライベートワークフォースを使用すると、以下が表示されます。-
identityProviderType
は、プライベートワークフォースを管理するために使用するサービスです。 -
issuer
は、この人間によるレビュータスクに割り当てられたワークチームに関連付けられた Amazon Cognito ユーザープールまたは OpenID Connect (OIDC) ID プロバイダー (IdP) 発行者です。 -
一意の
sub
識別子はワーカーを参照します。Amazon Cognito を使用してワークフォースを作成する場合、Amazon Cognito でこの ID に関連付けられているこのワーカーに関する詳細 (名前やユーザー名など) を取得できます。この方法については、Amazon Cognito デベロッパーガイドの「ユーザーアカウントの管理と検索」を参照してください。
-
Amazon Cognito を使用してプライベートワークフォースを作成した場合に表示される出力の例を次に示します。これは、identityProviderType
で識別されます。
"submissionTime": "2020-12-28T18:59:58.321Z", "acceptanceTime": "2020-12-28T18:59:15.191Z", "timeSpentInSeconds": 40.543, "workerId": "a12b3cdefg4h5i67", "workerMetadata": { "identityData": { "identityProviderType": "Cognito", "issuer": "https://cognito-idp.aws-region.amazonaws.com/aws-region_123456789", "sub": "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee" } }
独自の OIDC IdP を使用してプライベートワークフォースを作成した場合に表示される出力の例を次に示します。
"workerMetadata": { "identityData": { "identityProviderType": "Oidc", "issuer": "https://example-oidc-ipd.com/adfs", "sub": "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee" } }
プライベートワークフォースの使用の詳細については、「プライベートワークフォース」を参照してください。