Esquema para estadísticas (archivo statistics.json) - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Esquema para estadísticas (archivo statistics.json)

El esquema definido en el archivo statistics.json especifica los parámetros estadísticos que se van a calcular para la referencia y los datos que se capturan. También configura el cubo que utilizará KLL, un boceto de cuantiles muy compacto con un esquema de compactación lenta.

{ "version": 0, # dataset level stats "dataset": { "item_count": number }, # feature level stats "features": [ { "name": "feature-name", "inferred_type": "Fractional" | "Integral", "numerical_statistics": { "common": { "num_present": number, "num_missing": number }, "mean": number, "sum": number, "std_dev": number, "min": number, "max": number, "distribution": { "kll": { "buckets": [ { "lower_bound": number, "upper_bound": number, "count": number } ], "sketch": { "parameters": { "c": number, "k": number }, "data": [ [ num, num, num, num ], [ num, num ][ num, num ] ] }#sketch }#KLL }#distribution }#num_stats }, { "name": "feature-name", "inferred_type": "String", "string_statistics": { "common": { "num_present": number, "num_missing": number }, "distinct_count": number, "distribution": { "categorical": { "buckets": [ { "value": "string", "count": number } ] } } }, #provision for custom stats } ] }
Notas
  • Las métricas especificadas se reconocen SageMaker en los cambios de visualización posteriores. El contenedor puede emitir más métricas en caso necesario.

  • KLLEl boceto es el croquis reconocido. Los contenedores personalizados pueden escribir su propia representación, pero no se reconocerán SageMaker en las visualizaciones.

  • Por defecto, la distribución se materializa en 10 buckets. No puede cambiar este valor.