Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Schema per vincoli (file constraints.json)
Il file constraints.json viene usato per esprimere i vincoli che un set di dati deve soddisfare. I contenitori Amazon SageMaker Model Monitor possono utilizzare il file constraints.json per valutare i set di dati. I container esistenti offrono la possibilità di generare automaticamente il file constraints.json per un set di dati della baseline. Se porti il tuo container, puoi dotarlo di abilità simili o puoi creare il file constraints.json in altro modo. Ecco lo schema per il file di vincolo utilizzato dal container esistente. Portare i propri container consente di adottare lo stesso formato o migliorarlo in base alle necessità.
{ "version": 0, "features": [ { "name": "string", "inferred_type": "Integral" | "Fractional" | | "String" | "Unknown", "completeness": number, "num_constraints": { "is_non_negative": boolean }, "string_constraints": { "domains": [ "list of", "observed values", "for small cardinality" ] }, "monitoringConfigOverrides": {} } ], "monitoring_config": { "evaluate_constraints": "Enabled", "emit_metrics": "Enabled", "datatype_check_threshold": 0.1, "domain_content_threshold": 0.1, "distribution_constraints": { "perform_comparison": "Enabled", "comparison_threshold": 0.1, "comparison_method": "Simple"||"Robust", "categorical_comparison_threshold": 0.1, "categorical_drift_method": "LInfinity"||"ChiSquared" } } }
L'oggetto monitoring_config
contiene opzioni per il monitoraggio del processo relativo alla funzionalità. Nella tabella seguente è descritta ciascuna opzione.
Vincoli di monitoraggio
Vincolo | Descrizione |
---|---|
evaluate_constraints |
Quando Valori validi: Impostazione predefinita: |
emit_metrics |
When Valori validi: Impostazione predefinita: |
datatype_check_threshold |
Se la soglia è superiore al valore del Nella fase della linea di base, i vincoli generati suggeriscono il tipo di dati dedotto per ogni colonna. Il parametro Valori validi: float. Impostazione predefinita: 0.1 |
domain_content_threshold |
Se nel set di dati corrente sono presenti più valori sconosciuti per un campo String rispetto al set di dati della baseline, questa soglia può essere utilizzata per stabilire se deve essere contrassegnata come violazione. Valori validi: float. Impostazione predefinita: 0.1 |
distribution_constraints |
perform_comparison
Quando Valori validi: Impostazione predefinita: |
comparison_threshold
Se la soglia è superiore al valore impostato per Valori validi: Impostazione predefinita: 0.1 |
|
comparison_method
Se calcolare Valori validi: |
|
categorical_comparison_threshold Facoltativo. Imposta una soglia per le funzionalità categoriche. Se il valore nel set di dati supera la soglia impostata, nel rapporto di violazione viene registrata una violazione. Valori validi: float. Impostazione predefinita: il valore assegnato al parametro |
|
categorical_drift_method Facoltativo. Per le funzionalità categoriche, specifica il metodo di calcolo utilizzato per rilevare la deviazione della distribuzione. Se non impostate questo parametro, viene utilizzato il test K-S (LInfinity). Valori validi: Impostazione predefinita: |