k-means 하이퍼파라미터 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

k-means 하이퍼파라미터

CreateTrainingJob 요청에서 사용하고자 하는 훈련 알고리즘을 지정합니다. 알고리즘별 하이퍼파라미터를 맵으로 지정할 수도 있습니다. string-to-string 다음 표에는 Amazon에서 제공하는 k-means 훈련 알고리즘의 하이퍼파라미터가 나열되어 있습니다. SageMaker k-means 클러스터링 작동 방식에 대한 자세한 정보는 k-means 클러스터링 작동 방식 단원을 참조하세요.

파라미터 이름 설명
feature_dim

입력 데이터의 특징 수.

필수

유효한 값: 양수

k

필요한 클러스터 수.

필수

유효한 값: 양수

epochs

훈련 데이터에 대한 전달 횟수.

선택 사항

유효한 값: 양수

기본값: 1

eval_metrics

모델에 대한 점수를 보고하는 데 사용되는 지표 유형의 JSON 목록. 허용되는 값은 평균 제곱 편차의 경우 msd이고, 제곱 거리의 합의 경우 ssd입니다. 테스트 데이터가 제공된 경우에는 요청된 각 지표에 대해 점수가 보고됩니다.

선택 사항

유효한 값: [\"msd\"], [\"ssd\"] 또는 [\"msd\",\"ssd\"].

기본 값: [\"msd\"]

extra_center_factor

이 알고리즘은 실행 시 K 중심 = num_clusters * extra_center_factor를 생성하고 모델 완료 시 중심 수를 K에서 k로 줄입니다.

선택 사항

유효한 값: 양의 정수 또는 auto.

기본 값: auto

half_life_time_size

클러스터 평균을 계산할 때 관측치에 지정할 가중치를 결정하는 데 사용됩니다. 더 많은 지점을 관측할수록 가중치는 급격하게 감소합니다. 지점이 처음으로 관측되는 경우 클러스터 평균을 계산할 때 해당 지점에는 가중치 1이 할당됩니다. half_life_time_size 지점을 관측한 이후 가중치는 1/2이 되도록 지수 감소 함수의 감소 상수를 선택합니다. 0으로 설정된 경우 감퇴가 없습니다.

선택 사항

유효한 값: 음수가 아닌 정수

기본값: 0

init_method

이 알고리즘이 초기 클러스터 중심을 선택하는 메서드. 표준 k-means 접근 방식은 이러한 메서드를 무작위로 선택합니다. 대체 k-means++ 메서드는 첫 번째 클러스터 중심을 무작위로 선택합니다. 그런 다음 기존 중심에서 남은 데이터 포인트까지 거리의 제곱에 비례하는 가능성 분포로 중심 선택에 가중치를 부여해 초기 클러스터의 위치를 분산시킵니다.

선택 사항

유효한 값: random 또는 kmeans++.

기본 값: random

local_lloyd_init_method

k 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저에 대한 초기화 메서드.

선택 사항

유효한 값: random 또는 kmeans++.

기본 값: kmeans++

local_lloyd_max_iter

k 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저에 대한 최대 반복 횟수.

선택 사항

유효한 값: 양수

기본값: 300

local_lloyd_num_trials

k 중심이 포함된 최종 모델을 빌드하는 경우 손실이 가장 낮은 Lloyd의 Expectation–Maximization(EM) 프로시저가 실행되는 횟수.

선택 사항

유효한 값: 양의 정수 또는 auto.

기본 값: auto

local_lloyd_tol

k 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저의 조기 중지에 대한 손실 변화 내결함성.

선택 사항

유효한 값: 부동 소수점. 범위: [0, 1].

기본값: 0.0001

mini_batch_size

데이터 반복자의 미니 배치당 관측치의 수.

선택 사항

유효한 값: 양수

기본값: 5000