기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
k-means 하이퍼파라미터
CreateTrainingJob
요청에서 사용하고자 하는 훈련 알고리즘을 지정합니다. 알고리즘별 하이퍼파라미터를 문자열-문자열 맵으로 지정할 수 있습니다. 다음 표에는 Amazon SageMaker AI에서 제공하는 k-means 훈련 알고리즘의 하이퍼파라미터가 나열되어 있습니다. k-means 클러스터링 작동 방식에 대한 자세한 정보는 k-means 클러스터링 작동 방식 섹션을 참조하세요.
파라미터 이름 | 설명 |
---|---|
feature_dim |
입력 데이터의 특징 수. 필수 유효한 값: 양수 |
k |
필요한 클러스터 수. 필수 유효한 값: 양수 |
epochs |
훈련 데이터에 대한 전달 횟수. 선택 사항 유효한 값: 양수 기본값: 1 |
eval_metrics |
모델에 대한 점수를 보고하는 데 사용되는 지표 유형의 JSON 목록. 허용되는 값은 평균 제곱 편차의 경우 선택 사항 유효한 값: 기본 값: |
extra_center_factor |
이 알고리즘은 실행 시 K 중심 = 선택 사항 유효한 값: 양의 정수 또는 기본 값: |
half_life_time_size |
클러스터 평균을 계산할 때 관측치에 지정할 가중치를 결정하는 데 사용됩니다. 더 많은 지점을 관측할수록 가중치는 급격하게 감소합니다. 지점이 처음으로 관측되는 경우 클러스터 평균을 계산할 때 해당 지점에는 가중치 1이 할당됩니다. 선택 사항 유효한 값: 음수가 아닌 정수 기본값: 0 |
init_method |
이 알고리즘이 초기 클러스터 중심을 선택하는 메서드. 표준 k-means 접근 방식은 이러한 메서드를 무작위로 선택합니다. 대체 k-means++ 메서드는 첫 번째 클러스터 중심을 무작위로 선택합니다. 그런 다음 기존 중심에서 남은 데이터 포인트까지 거리의 제곱에 비례하는 가능성 분포로 중심 선택에 가중치를 부여해 초기 클러스터의 위치를 분산시킵니다. 선택 사항 유효한 값: 기본 값: |
local_lloyd_init_method |
선택 사항 유효한 값: 기본 값: |
local_lloyd_max_iter |
선택 사항 유효한 값: 양수 기본값: 300 |
local_lloyd_num_trials |
선택 사항 유효한 값: 양의 정수 또는 기본 값: |
local_lloyd_tol |
선택 사항 유효한 값: 부동 소수점. 범위: [0, 1]. 기본값: 0.0001 |
mini_batch_size |
데이터 반복자의 미니 배치당 관측치의 수. 선택 사항 유효한 값: 양수 기본값: 5000 |