Programación de trabajos de supervisión de la calidad del modelo
Una vez que haya creado su referencia, puede utilizar el método create_monitoring_schedule()
de la instancia de clase ModelQualityMonitor
para programar una supervisión de calidad del modelo cada hora. En las siguientes secciones, se muestra cómo crear un monitor de calidad del modelo para un modelo implementado en un punto de conexión en tiempo real, así como para un trabajo de transformación por lotes.
importante
Puede especificar una entrada de transformación por lotes o una entrada de punto de conexión, pero no ambas, al crear su programa de supervisión.
A diferencia de la supervisión de la calidad de los datos, debe suministrar etiquetas Ground Truth si desea supervisar la calidad del modelo. Sin embargo, las etiquetas de Ground Truth podrían retrasarse. Para solucionar este problema, especifique los desplazamientos al crear su programa de supervisión.
Desplazamientos del monitor de modelos
Los trabajos de calidad del modelo incluyen StartTimeOffset
y EndTimeOffset
, que son campos del parámetro ModelQualityJobInput
del método create_model_quality_job_definition
que funcionan de la siguiente manera:
-
StartTimeOffset
: si se especifica, los trabajos restan este tiempo de la hora de inicio. -
EndTimeOffset
: si se especifica, los trabajos restan este tiempo de la hora de finalización.
El formato de los desplazamientos es, por ejemplo, -PT7H, donde 7H son 7 horas. Puede usar -PT#H o -P#D, donde H=horas, D=días y M=minutos, y # es el número. Además, el desplazamiento debe tener el formato de duración ISO 8601
Por ejemplo, si Ground Truth comienza a llegar después de 1 día, pero no se completa hasta dentro de una semana, establezca StartTimeOffset
en -P8D
y EndTimeOffset
en -P1D
. Luego, si programa un trabajo para que se ejecute el 2020-01-09T13:00
, analizará los datos entre 2020-01-01T13:00
y2020-01-08T13:00
.
importante
La cadencia de la programación debe ser tal que una ejecución finalice antes de que comience la siguiente, lo que permite que Ground Truth combine el trabajo y supervise el trabajo desde la ejecución hasta que se complete. El tiempo de ejecución máximo de una ejecución se divide entre los dos trabajos, por lo que, en el caso de un trabajo de supervisión de la calidad del modelo cada hora, el valor de MaxRuntimeInSeconds
especificado como parte de StoppingCondition
no debe ser superior a 1800.
Supervisión de la calidad del modelo para los modelos implementados en puntos de conexión en tiempo real
Para programar un monitor de calidad del modelo para un punto de conexión en tiempo real, pase la instancia EndpointInput
al argumento endpoint_input
de la instancia ModelQualityMonitor
, como se muestra en el siguiente ejemplo de código:
from sagemaker.model_monitor import CronExpressionGenerator model_quality_model_monitor = ModelQualityMonitor( role=sagemaker.get_execution_role(), ... ) schedule = model_quality_model_monitor.create_monitoring_schedule( monitor_schedule_name=schedule_name, post_analytics_processor_script=s3_code_postprocessor_uri, output_s3_uri=s3_report_path, schedule_cron_expression=CronExpressionGenerator.hourly(), statistics=model_quality_model_monitor.baseline_statistics(), constraints=model_quality_model_monitor.suggested_constraints(), schedule_cron_expression=CronExpressionGenerator.hourly(), enable_cloudwatch_metrics=True, endpoint_input=EndpointInput( endpoint_name=endpoint_name, destination="/opt/ml/processing/input/endpoint", start_time_offset="-PT2D", end_time_offset="-PT1D", ) )
Supervisión de la calidad del modelo para trabajos de transformación por lotes
Para programar un monitor de calidad del modelo para un trabajo de transformación por lotes, pase la instancia BatchTransformInput
al argumento batch_transform_input
de la instancia ModelQualityMonitor
, como se muestra en el siguiente ejemplo de código:
from sagemaker.model_monitor import CronExpressionGenerator model_quality_model_monitor = ModelQualityMonitor( role=sagemaker.get_execution_role(), ... ) schedule = model_quality_model_monitor.create_monitoring_schedule( monitor_schedule_name=mon_schedule_name, batch_transform_input=BatchTransformInput( data_captured_destination_s3_uri=s3_capture_upload_path, destination="/opt/ml/processing/input", dataset_format=MonitoringDatasetFormat.csv(header=False), # the column index of the output representing the inference probablity probability_attribute="0", # the threshold to classify the inference probablity to class 0 or 1 in # binary classification problem probability_threshold_attribute=0.5, # look back 6 hour for transform job outputs. start_time_offset="-PT6H", end_time_offset="-PT0H" ), ground_truth_input=gt_s3_uri, output_s3_uri=s3_report_path, problem_type="BinaryClassification", constraints = constraints_path, schedule_cron_expression=CronExpressionGenerator.hourly(), enable_cloudwatch_metrics=True, )