통계에 대한 스키마(statistics.json 파일)
Amazon SageMaker 모델 모니터는 열/기능 통계를 기준으로 사전 빌드된 컨테이너를 계산합니다. 통계는 기준 데이터세트를 비롯해 분석 중인 현재 데이터세트에 대 계산됩니다.
{ "version": 0, # dataset level stats "dataset": { "item_count": number }, # feature level stats "features": [ { "name": "feature-name", "inferred_type": "Fractional" | "Integral", "numerical_statistics": { "common": { "num_present": number, "num_missing": number }, "mean": number, "sum": number, "std_dev": number, "min": number, "max": number, "distribution": { "kll": { "buckets": [ { "lower_bound": number, "upper_bound": number, "count": number } ], "sketch": { "parameters": { "c": number, "k": number }, "data": [ [ num, num, num, num ], [ num, num ][ num, num ] ] }#sketch }#KLL }#distribution }#num_stats }, { "name": "feature-name", "inferred_type": "String", "string_statistics": { "common": { "num_present": number, "num_missing": number }, "distinct_count": number, "distribution": { "categorical": { "buckets": [ { "value": "string", "count": number } ] } } }, #provision for custom stats } ] }
유의할 사항:
-
사전 빌드 컨테이너는 컴팩트한 분위 스케치인 KLL 스케치
를 계산합니다. -
기본적으로 10개의 버킷으로 분포를 구체화합니다. 현재는 구성이 불가능합니다.