Pianifica i processi di monitoraggio della qualità dei dati - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Pianifica i processi di monitoraggio della qualità dei dati

Dopo aver creato la linea di base, puoi chiamare il metodo create_monitoring_schedule() dell'istanza di classe DefaultModelMonitor, per pianificare un monitoraggio orario della qualità dei dati. Le sezioni seguenti mostrano come creare un monitoraggio della qualità dei dati, per modelli distribuiti su un endpoint in tempo reale e per processi di trasformazione di batch.

Importante

È possibile specificare un input di trasformazione di batch o un input dell'endpoint, ma non entrambi, quando si crea la pianificazione del monitoraggio.

Monitoraggio della qualità dei dati distribuiti su endpoint in tempo reale

Per pianificare un monitoraggio della qualità dei dati su un endpoint in tempo reale, passa l'istanza EndpointInput all'argomento endpoint_input dell'istanza DefaultModelMonitor, come mostrato nel seguente esempio di codice:

from sagemaker.model_monitor import CronExpressionGenerator data_quality_model_monitor = DefaultModelMonitor( role=sagemaker.get_execution_role(), ... ) schedule = data_quality_model_monitor.create_monitoring_schedule( monitor_schedule_name=schedule_name, post_analytics_processor_script=s3_code_postprocessor_uri, output_s3_uri=s3_report_path, schedule_cron_expression=CronExpressionGenerator.hourly(), statistics=data_quality_model_monitor.baseline_statistics(), constraints=data_quality_model_monitor.suggested_constraints(), schedule_cron_expression=CronExpressionGenerator.hourly(), enable_cloudwatch_metrics=True, endpoint_input=EndpointInput( endpoint_name=endpoint_name, destination="/opt/ml/processing/input/endpoint", ) )

Monitoraggio della qualità dei dati per i processi di trasformazione di batch

Per pianificare un monitoraggio della qualità dei dati in un processo di trasformazione di batch, passa l'istanza BatchTransformInput all'argomento batch_transform_input dell'istanza DefaultModelMonitor, come mostrato nel seguente esempio di codice:

from sagemaker.model_monitor import CronExpressionGenerator data_quality_model_monitor = DefaultModelMonitor( role=sagemaker.get_execution_role(), ... ) schedule = data_quality_model_monitor.create_monitoring_schedule( monitor_schedule_name=mon_schedule_name, batch_transform_input=BatchTransformInput( data_captured_destination_s3_uri=s3_capture_upload_path, destination="/opt/ml/processing/input", dataset_format=MonitoringDatasetFormat.csv(header=False), ), output_s3_uri=s3_report_path, statistics= statistics_path, constraints = constraints_path, schedule_cron_expression=CronExpressionGenerator.hourly(), enable_cloudwatch_metrics=True, )