As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Esquema para restrições (arquivo constraints.json)
Um arquivo constraints.json é usado para expressar as restrições que um conjunto de dados deve satisfazer. Os contêineres SageMaker do Amazon Model Monitor podem usar o arquivo constraints.json para avaliar os conjuntos de dados. Os contêineres pré-criados fornecem a capacidade de gerar o arquivo constraints.json automaticamente para um conjunto de dados da linha de base. Se você trouxer seu próprio contêiner, será possível fornecê-lo com habilidades semelhantes ou você poderá criar o arquivo constraints.json de alguma outra maneira. Veja a seguir o esquema para o arquivo de restrição que o contêiner pré-criado usa. Ao trazer seus próprios contêineres, é possível adotar o mesmo formato ou melhorá-lo conforme necessário.
{ "version": 0, "features": [ { "name": "string", "inferred_type": "Integral" | "Fractional" | | "String" | "Unknown", "completeness": number, "num_constraints": { "is_non_negative": boolean }, "string_constraints": { "domains": [ "list of", "observed values", "for small cardinality" ] }, "monitoringConfigOverrides": {} } ], "monitoring_config": { "evaluate_constraints": "Enabled", "emit_metrics": "Enabled", "datatype_check_threshold": 0.1, "domain_content_threshold": 0.1, "distribution_constraints": { "perform_comparison": "Enabled", "comparison_threshold": 0.1, "comparison_method": "Simple"||"Robust", "categorical_comparison_threshold": 0.1, "categorical_drift_method": "LInfinity"||"ChiSquared" } } }
O objeto monitoring_config
contém opções para o trabalho de monitoramento do recurso. A tabela a seguir descreve cada opção.
Monitoramento de restrições
Restrição | Descrição |
---|---|
evaluate_constraints |
Quando é Valores válidos: Padrão: |
emit_metrics |
Quando Valores válidos: Padrão: |
datatype_check_threshold |
Se o limite estiver acima do valor do especificado Durante a etapa da linha de base, as restrições geradas sugerem o tipo de dados inferidos para cada coluna. O parâmetro Valores válidos: flutuante Padrão: 0.1 |
domain_content_threshold |
Se houver mais valores desconhecidos para um campo String no conjunto de dados atual do que no conjunto de dados da linha de base, esse limite poderá ser usado para ditar se ele precisa ser sinalizado como uma violação. Valores válidos: flutuante Padrão: 0.1 |
distribution_constraints |
perform_comparison
Quando Valores válidos: Padrão: |
comparison_threshold
Se o limite estiver acima do valor definido para o Valores válidos: flutuante Padrão: 0.1 |
|
comparison_method
Se calcular Valores válidos: |
|
categorical_comparison_threshold Opcional. Define um limite para recursos categóricos. Se o valor no conjunto de dados exceder o limite definido, uma violação será registrada no relatório de violação. Valores válidos: flutuante Padrão: valor atribuído ao parâmetro |
|
categorical_drift_method Opcional. Para recursos categóricos, especifica o método de cálculo usado para detectar o desvio de distribuição. Se você não definir esse parâmetro, o teste K-S (LInfinity) será usado. Valores válidos: Padrão: |