Schéma des statistiques (fichier statistics.json) - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Schéma des statistiques (fichier statistics.json)

Le conteneur SageMaker prédéfini Amazon Model Monitor calcule les statistiques par colonne/fonctionnalité. Les statistiques sont calculées pour l'ensemble de données de référence, ainsi que pour le jeu de données en cours d'analyse.

{ "version": 0, # dataset level stats "dataset": { "item_count": number }, # feature level stats "features": [ { "name": "feature-name", "inferred_type": "Fractional" | "Integral", "numerical_statistics": { "common": { "num_present": number, "num_missing": number }, "mean": number, "sum": number, "std_dev": number, "min": number, "max": number, "distribution": { "kll": { "buckets": [ { "lower_bound": number, "upper_bound": number, "count": number } ], "sketch": { "parameters": { "c": number, "k": number }, "data": [ [ num, num, num, num ], [ num, num ][ num, num ] ] }#sketch }#KLL }#distribution }#num_stats }, { "name": "feature-name", "inferred_type": "String", "string_statistics": { "common": { "num_present": number, "num_missing": number }, "distinct_count": number, "distribution": { "categorical": { "buckets": [ { "value": "string", "count": number } ] } } }, #provision for custom stats } ] }

Notez ce qui suit :

  • Les conteneurs prédéfinis calculent une KLLesquisse, qui est une esquisse de quantiles compacte.

  • Par défaut, nous matérialisons la distribution en dix compartiments. Actuellement, ceci n'est pas configurable.