Skema untuk Statistik (file statistik.json) - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Skema untuk Statistik (file statistik.json)

Skema yang didefinisikan dalam statistics.json file menentukan parameter statistik yang akan dihitung untuk baseline dan data yang ditangkap. Ini juga mengkonfigurasi bucket yang akan digunakan oleh KLL, sketsa kuantil yang sangat ringkas dengan skema pemadatan malas.

{ "version": 0, # dataset level stats "dataset": { "item_count": number }, # feature level stats "features": [ { "name": "feature-name", "inferred_type": "Fractional" | "Integral", "numerical_statistics": { "common": { "num_present": number, "num_missing": number }, "mean": number, "sum": number, "std_dev": number, "min": number, "max": number, "distribution": { "kll": { "buckets": [ { "lower_bound": number, "upper_bound": number, "count": number } ], "sketch": { "parameters": { "c": number, "k": number }, "data": [ [ num, num, num, num ], [ num, num ][ num, num ] ] }#sketch }#KLL }#distribution }#num_stats }, { "name": "feature-name", "inferred_type": "String", "string_statistics": { "common": { "num_present": number, "num_missing": number }, "distinct_count": number, "distribution": { "categorical": { "buckets": [ { "value": "string", "count": number } ] } } }, #provision for custom stats } ] }
Catatan
  • Metrik yang ditentukan dikenali oleh SageMaker perubahan visualisasi selanjutnya. Wadah dapat memancarkan lebih banyak metrik jika diperlukan.

  • KLLsketsa adalah sketsa yang diakui. Wadah khusus dapat menulis representasi mereka sendiri, tetapi tidak akan dikenali oleh SageMaker visualisasi.

  • Secara default, distribusi diwujudkan dalam 10 ember. Kau tak bisa mengubah ini.