Esquema para infracciones (archivo constraint_violations.json) - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Esquema para infracciones (archivo constraint_violations.json)

El archivo de infracciones se genera como la salida de a MonitoringExecution, que enumera los resultados de la evaluación de las infracciones (especificadas en el archivo constraints.json) respecto al conjunto de datos actual que se analizó. El contenedor prediseñado de Amazon SageMaker Model Monitor proporciona las siguientes comprobaciones de infracciones.

{ "violations": [{ "feature_name" : "string", "constraint_check_type" : "data_type_check", | "completeness_check", | "baseline_drift_check", | "missing_column_check", | "extra_column_check", | "categorical_values_check" "description" : "string" }] }

Tipos de infracciones supervisadas

Tipo de comprobación de infracción Descripción
data_type_check

Si los tipos de datos de la ejecución actual no son los mismos que en el conjunto de datos de referencia, se marca esta infracción.

Durante el paso de línea base, las restricciones generadas sugieren el tipo de datos inferido para cada columna. El parámetro monitoring_config.datatype_check_threshold se puede modificar para ajustar el umbral cuando se marca como infracción.

completeness_check

Si la integridad (% de elementos no nulos) observada en la ejecución actual supera el umbral especificado en el umbral de integridad especificado por característica, se marca esta infracción.

Durante el paso de referencia, las restricciones generadas sugieren un valor de integridad.

baseline_drift_check

Si la distancia de distribución calculada entre los conjuntos de datos actual y de referencia es mayor que el umbral especificado en monitoring_config.comparison_threshold, se marca esta infracción.

missing_column_check

Si el número de columnas en el conjunto de datos actual es menor que el número en el conjunto de datos de referencia, se marca esta infracción.

extra_column_check

Si el número de columnas del conjunto de datos actual es mayor que el número en la referencia, se marca esta infracción.

categorical_values_check

Si hay más valores desconocidos en el conjunto de datos actual que en el conjunto de datos de referencia, se marca esta infracción. Este valor viene dictado por el umbral de monitoring_config.domain_content_threshold.