데이터 품질 모니터링 작업 스케줄링 - Amazon SageMaker

데이터 품질 모니터링 작업 스케줄링

기준 생성을 마쳤다면, DefaultModelMonitor클래스 인스턴스의 create_monitoring_schedule()메서드를 호출하여 시간별 데이터 품질 모니터를 예약할 수 있습니다. 다음 섹션은 실시간 엔드포인트에 배포된 모델 및 배치 변환 작업에 사용할 데이터 품질 모니터를 생성하는 방법을 보여줍니다.

중요

모니터링 일정을 생성할 때는 배치 변환 입력이나 엔드포인트 입력 중에서 하나를 지정할 수 있지만, 둘 다 지정할 수는 없습니다.

실시간 엔드포인트에 배포된 모델에 대한 데이터 품질 모니터링

실시간 엔드포인트에 대한 데이터 품질 모니터를 예약하려면, 다음 코드 샘플에 나와 있는 것처럼 EndpointInput인스턴스를 DefaultModelMonitor인스턴스의 endpoint_input인수로 전달하세요.

from sagemaker.model_monitor import CronExpressionGenerator data_quality_model_monitor = DefaultModelMonitor( role=sagemaker.get_execution_role(), ... ) schedule = data_quality_model_monitor.create_monitoring_schedule( monitor_schedule_name=schedule_name, post_analytics_processor_script=s3_code_postprocessor_uri, output_s3_uri=s3_report_path, schedule_cron_expression=CronExpressionGenerator.hourly(), statistics=data_quality_model_monitor.baseline_statistics(), constraints=data_quality_model_monitor.suggested_constraints(), schedule_cron_expression=CronExpressionGenerator.hourly(), enable_cloudwatch_metrics=True, endpoint_input=EndpointInput( endpoint_name=endpoint_name, destination="/opt/ml/processing/input/endpoint", ) )

배치 변환 작업에 대한 데이터 품질 모니터링

배치 변환 작업에 대한 데이터 품질 모니터를 예약하려면, 다음 코드 샘플에 나와 있는 것처럼 BatchTransformInput인스턴스를 DefaultModelMonitor인스턴스의 batch_transform_input인수로 전달하세요.

from sagemaker.model_monitor import CronExpressionGenerator data_quality_model_monitor = DefaultModelMonitor( role=sagemaker.get_execution_role(), ... ) schedule = data_quality_model_monitor.create_monitoring_schedule( monitor_schedule_name=mon_schedule_name, batch_transform_input=BatchTransformInput( data_captured_destination_s3_uri=s3_capture_upload_path, destination="/opt/ml/processing/input", dataset_format=MonitoringDatasetFormat.csv(header=False), ), output_s3_uri=s3_report_path, statistics= statistics_path, constraints = constraints_path, schedule_cron_expression=CronExpressionGenerator.hourly(), enable_cloudwatch_metrics=True, )