Esquema para violações (arquivo constraint_violations.json) - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Esquema para violações (arquivo constraint_violations.json)

O arquivo de violações é gerado como a saída de um MonitoringExecution, que lista os resultados da avaliação das restrições (especificadas no arquivo constraints.json) em relação ao conjunto de dados atual que foi analisado. O contêiner pré-construído Amazon SageMaker Model Monitor fornece as seguintes verificações de violação.

{ "violations": [{ "feature_name" : "string", "constraint_check_type" : "data_type_check", | "completeness_check", | "baseline_drift_check", | "missing_column_check", | "extra_column_check", | "categorical_values_check" "description" : "string" }] }

Tipos de violações monitoradas

Tipo de verificação de violação Descrição
data_type_check

Se os tipos de dados na execução atual não forem os mesmos que no conjunto de dados da linha de base, essa violação será sinalizada.

Durante a etapa da linha de base, as restrições geradas sugerem o tipo de dados inferidos para cada coluna. O parâmetro monitoring_config.datatype_check_threshold pode ser regulado para ajustar o limite quando for sinalizado como uma violação.

completeness_check

Se a completude (% de itens não nulos) observada na execução atual exceder o limite especificado no limite de completude especificado por recurso, essa violação será sinalizada.

Durante a etapa da linha de base, as restrições geradas sugerem um valor de completude.

baseline_drift_check

Se a distância de distribuição calculada entre os conjuntos de dados atual e da linha de base for maior do que o limite especificado em monitoring_config.comparison_threshold, essa violação será sinalizada.

missing_column_check

Se o número de colunas no conjunto de dados atual for menor que o número no conjunto de dados da linha de base, essa violação será sinalizada.

extra_column_check

Se o número de colunas no conjunto de dados atual for maior que o número na linha de base, essa violação será sinalizada.

categorical_values_check

Se houver mais valores desconhecidos no conjunto de dados atual do que no conjunto de dados da linha de base, essa violação será sinalizada. Esse valor é ditado pelo limite em monitoring_config.domain_content_threshold.