特徴属性ドリフトのモニタリングジョブをスケジュールする - Amazon SageMaker

特徴属性ドリフトのモニタリングジョブをスケジュールする

SHAP ベースラインを作成したら、ModelExplainabilityMonitor クラスインスタンスの create_monitoring_schedule() メソッドを呼び出して、1 時間ごとにモデル説明可能性モニターをスケジュールできます。以下のセクションでは、リアルタイムエンドポイントにデプロイされたモデルとバッチ変換ジョブのモデル説明可能性モニターを作成する方法を示します。

重要

モニタリングスケジュールを作成するときに、バッチ変換入力またはエンドポイント入力のいずれかを指定できますが、両方を指定することはできません。

ベースライン作成ジョブを送信済みである場合、モニタリングジョブはベースライン作成ジョブから分析設定を自動的に取得します。ベースライン作成のステップをスキップした場合、またはキャプチャするデータセットがトレーニングデータセットと異なる性質を持つ場合は、分析設定を指定する必要があります。ExplainabilityAnalysisConfig には、ベースライン作成ジョブで必要とされるのと同じ理由で ModelConfig が必要となります。特徴量属性の計算に必要なのは特徴量のみであるため、Ground Truth ラベリングを除外する必要があります。

リアルタイムエンドポイントにデプロイされたモデルの特徴量属性ドリフトモニタリング

リアルタイムエンドポイントのモデル説明可能性モニターをスケジュールするには、次のコードサンプルに示すように、EndpointInput インスタンスを ModelExplainabilityMonitor インスタンスの endpoint_input 引数に渡します。

from sagemaker.model_monitor import CronExpressionGenerator model_exp_model_monitor = ModelExplainabilityMonitor( role=sagemaker.get_execution_role(), ... ) schedule = model_exp_model_monitor.create_monitoring_schedule( monitor_schedule_name=schedule_name, post_analytics_processor_script=s3_code_postprocessor_uri, output_s3_uri=s3_report_path, statistics=model_exp_model_monitor.baseline_statistics(), constraints=model_exp_model_monitor.suggested_constraints(), schedule_cron_expression=CronExpressionGenerator.hourly(), enable_cloudwatch_metrics=True, endpoint_input=EndpointInput( endpoint_name=endpoint_name, destination="/opt/ml/processing/input/endpoint", ) )

バッチ変換ジョブ特徴量属性ドリフトモニタリング

バッチ変換ジョブのモデル説明可能性モニターをスケジュールするには、次のコードサンプルに示すように、BatchTransformInput インスタンスを ModelExplainabilityMonitor インスタンスの batch_transform_input 引数に渡します。

from sagemaker.model_monitor import CronExpressionGenerator model_exp_model_monitor = ModelExplainabilityMonitor( role=sagemaker.get_execution_role(), ... ) schedule = model_exp_model_monitor.create_monitoring_schedule( monitor_schedule_name=schedule_name, post_analytics_processor_script=s3_code_postprocessor_uri, output_s3_uri=s3_report_path, statistics=model_exp_model_monitor.baseline_statistics(), constraints=model_exp_model_monitor.suggested_constraints(), schedule_cron_expression=CronExpressionGenerator.hourly(), enable_cloudwatch_metrics=True, batch_transform_input=BatchTransformInput( destination="opt/ml/processing/data", model_name="batch-fraud-detection-model", input_manifests_s3_uri="s3://amzn-s3-demo-bucket/batch-fraud-detection/on-schedule-monitoring/in/", excludeFeatures="0", ) )