本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
統計資料的結構描述 (statistics.json 檔案)
針對基準和擷取的資料,statistics.json
檔案中定義的結構描述指定要計算的統計參數。另外還設定儲存貯體供 KLL
{ "version": 0, # dataset level stats "dataset": { "item_count": number }, # feature level stats "features": [ { "name": "feature-name", "inferred_type": "Fractional" | "Integral", "numerical_statistics": { "common": { "num_present": number, "num_missing": number }, "mean": number, "sum": number, "std_dev": number, "min": number, "max": number, "distribution": { "kll": { "buckets": [ { "lower_bound": number, "upper_bound": number, "count": number } ], "sketch": { "parameters": { "c": number, "k": number }, "data": [ [ num, num, num, num ], [ num, num ][ num, num ] ] }#sketch }#KLL }#distribution }#num_stats }, { "name": "feature-name", "inferred_type": "String", "string_statistics": { "common": { "num_present": number, "num_missing": number }, "distinct_count": number, "distribution": { "categorical": { "buckets": [ { "value": "string", "count": number } ] } } }, #provision for custom stats } ] }
備註
-
在稍後的視覺化變更中,SageMaker AI 會辨識指定的指標。如果需要,容器可以發出更多指標。
-
KLL 草圖
是可辨識的草圖。自訂容器可以撰寫自己的表示法,但 SageMaker AI 在視覺化效果中無法辨識。 -
依預設,分成 10 個儲存貯體將分佈具體化。這無法變更。