コンテナコントラクトの入力 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

コンテナコントラクトの入力

Amazon SageMaker Model Monitor プラットフォームは、指定されたスケジュールに従ってコンテナコードを呼び出します。独自のコンテナコードを記述する場合は、次の環境変数を使用できます。このコンテキストでは、現在のデータセットを分析することができます。また、メトリクスを選択して出力する場合は、制約を評価できます (該当する場合)。

使用可能な環境変数は、dataset_format 変数を除いてリアルタイムエンドポイントでもバッチ変換ジョブでも同じです。リアルタイムエンドポイントを使用している場合、dataset_format 変数は以下のオプションをサポートします。

{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}

バッチ変換ジョブを使用している場合、dataset_format は次のオプションをサポートします。

{\"csv\": {\"header\": [\"true\",\"false\"]}}
{\"json\": {\"line\": [\"true\",\"false\"]}}
{\"parquet\": {}}

以下のコードサンプルは、コンテナコードで使用できる環境変数一式を示しています (リアルタイムエンドポイントの dataset_format 形式も使用しています)。

"Environment": { "dataset_format": "{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}", "dataset_source": "/opt/ml/processing/endpointdata", "end_time": "2019-12-01T16: 20: 00Z", "output_path": "/opt/ml/processing/resultdata", "publish_cloudwatch_metrics": "Disabled", "sagemaker_endpoint_name": "endpoint-name", "sagemaker_monitoring_schedule_name": "schedule-name", "start_time": "2019-12-01T15: 20: 00Z" }

パラメータ

Parameter Name 説明
dataset_format

Endpoint によって支援された MonitoringSchedule から開始されたジョブでは、これは endpointInputendpointOutput、またはその両方のキャプチャインデックスを持つ sageMakerCaptureJson になります。バッチ変換ジョブでは、、、JSONまたは Parquet CSVのいずれかのデータ形式を指定します。

dataset_source

リアルタイム エンドポイントを使用している場合、start_timeend_time で指定されたモニタリング期間に対応するデータが使用可能なローカルパス。このパスでは、データは /{endpoint-name}/{variant-name}/yyyy/mm/dd/hh で使用できます。

開始時刻と終了時刻で指定されているものよりも多くのデータをダウンロードする場合があります。必要に応じてデータを解析するかどうかはコンテナコード次第です。

output_path

出力レポートおよびその他のファイルを書き込むためのローカルパス。CreateMonitoringSchedule リクエストでこのパラメータを MonitoringOutputConfig.MonitoringOutput[0].LocalPath として指定します。これは、MonitoringOutputConfig.MonitoringOutput[0].S3Uri に指定された S3Uri パスにアップロードされます。

publish_cloudwatch_metrics

CreateMonitoringSchedule によって起動されたジョブでは、このパラメータは Enabled に設定されます。コンテナは、Amazon CloudWatch 出力ファイルを に書き込むことができます[filepath]

sagemaker_endpoint_name

リアルタイムエンドポイントを使用している場合は、このスケジュール済みジョブが起動された Endpoint の名前です。

sagemaker_monitoring_schedule_name

このジョブを起動した MonitoringSchedule の名前。

*sagemaker_endpoint_datacapture_prefix*

リアルタイムエンドポイントを使用している場合は、EndpointDataCaptureConfig パラメータで指定されたプレフィックス。コンテナは、dataset_sourceパス SageMaker で によって既にダウンロードされているよりも多くのデータに直接アクセスする必要がある場合に、これを使用できます。

start_time, end_time

この分析の実行期間。例えば、05:00 に実行が予定されているジョブUTCと 20/02/2020 に実行されるジョブの場合、start_time: は 2020-02-19T06:00:00Z で、end_time: は 2020-02-20T05:00:00Z です。

baseline_constraints:

BaselineConfig.ConstraintResource.S3Uri で指定されているベースライン制約ファイルのローカルパス。これは、このパラメータが CreateMonitoringSchedule リクエストで指定された場合にのみ使用できます。

baseline_statistics

BaselineConfig.StatisticsResource.S3Uri で指定したベースライン統計ファイルへのローカルパス。これは、このパラメータが CreateMonitoringSchedule リクエストで指定された場合にのみ使用できます。