翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Ground Truth ラベルを取り込み、予測とマージする
モデル品質モニタリングでは、モデルの予測を正解ラベルと比較し、モデルの品質を測定します。これを機能させるには、エンドポイントでキャプチャされたデータを定期的にラベル付けし、Amazon S3 にアップロードする必要がありますます。
Ground Truth ラベルとキャプチャされた予測データを照合するには、データセット内の各レコードに一意の識別子が必要です。正解データの各レコードの構造は次のとおりです。
{ "groundTruthData": { "data": "1", "encoding": "CSV" # only CSV supported at launch, we assume "data" only consists of label }, "eventMetadata": { "eventId": "aaaa-bbbb-cccc" }, "eventVersion": "0" }
groundTruthData
の構造において、eventId
の値は次のいずれかになります。
-
eventId
— この ID は、ユーザーがエンドポイントを呼び出すと自動的に生成されます。 -
inferenceId
— この ID は、呼び出したユーザーがエンドポイントを呼び出すときに指定します。
inferenceId
がキャプチャされたデータレコードに存在する場合、Model Monitor はそれを使用してキャプチャされたデータを Ground Truth レコードとマージします。Ground Truth レコードにある inferenceId
がキャプチャされたレコードの inferenceId
と一致していることを確認する作業はユーザーが行う必要があります。inferenceId
がキャプチャされたデータレコードに存在しない場合、Model Monitor はキャプチャされたデータの eventId
を使用して Ground Truth レコードと照合します。
Ground Truth データは、キャプチャされたデータと同じパス形式の Amazon S3 バケットにアップロードする必要があります。これは、次の形式です。
s3://
bucket
/prefix
/yyyy
/mm
/dd
/hh
このパスの日付は、Ground Truth ラベルが収集された日付です。推論が生成された日付と一致している必要はありません。
Ground Truth ラベルを作成してアップロードした後、モニタリングジョブを作成するときにそのラベルの場所をパラメータとして含めます。を使用している場合は AWS SDK for Python (Boto3)、Ground Truth ラベルの場所を create_model_quality_job_definition
メソッドの呼び出しの GroundTruthS3Input
パラメータの S3Uri
フィールドとして指定して、これを行います。 SageMaker Python を使用している場合はSDK、Ground Truth ラベルの場所をModelQualityMonitor
オブジェクトの への呼び出しの ground_truth_input
パラメータとして指定create_monitoring_schedule
します。