기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
LightGBM 모델을 튜닝하세요.
자동 모델 튜닝은 하이퍼파라미터 튜닝이라고도 하며, 훈련 데이터세트 및 검증 데이터세트에 대한 다양한 하이퍼파라미터를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾는 기능입니다. 모델 튜닝은 다음과 같은 하이퍼파라미터에 초점을 맞춥니다.
참고
훈련 목표 함수는 레이블 열의 고유 정수 수에 따라 결정되는 분류 작업 유형에 따라 자동으로 할당됩니다. 자세한 내용은 라이트GBM 하이퍼파라미터 섹션을 참조하세요.
-
모델 훈련 중에 최적화하기 위한 학습 목표 함수
-
검증 중에 모델 성능을 평가하는 데 사용되는 평가 지표
-
모델을 자동으로 튜닝할 때 사용하기 쉬운 하이퍼파라미터 세트와 일정한 범위의 값
자동 모델 튜닝은 지정된 하이퍼파라미터를 검색하여 선택한 평가 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다.
참고
LightGBM에 대한 자동 모델 튜닝은 Amazon SageMaker SageMaker AI SDKs에서만 사용할 수 있습니다.
모델 튜닝에 대한 추가 정보는 SageMaker AI를 사용한 자동 모델 튜닝 섹션을 참조하세요.
LightGBM 알고리즘으로 계산되는 평가 지표
SageMaker AI LightGBM 알고리즘은 모델 검증에 사용할 다음 지표를 계산합니다. 평가 지표는 분류 작업 유형(레이블 열에 표시된 고유 정수의 개수로 결정됨)에 따라 자동으로 할당됩니다.
지표 이름 | 설명 | 최적화 방향 | 정규식 패턴 |
---|---|---|---|
rmse |
평균 제곱근 오차 | 최소화 | "rmse: ([0-9\\.]+)" |
l1 |
평균 절대 오차 | 최소화 | "l1: ([0-9\\.]+)" |
l2 |
평균 제곱 오차 | 최소화 | "l2: ([0-9\\.]+)" |
huber |
Huber 손실 | 최소화 | "huber: ([0-9\\.]+)" |
fair |
공정 손실 | 최소화 | "fair: ([0-9\\.]+)" |
binary_logloss |
바이너리 크로스 엔트로피 | 최대화 | "binary_logloss: ([0-9\\.]+)" |
binary_error |
바이너리 오류 | 최소화 | "binary_error: ([0-9\\.]+)" |
auc |
AUC | 최대화 | "auc: ([0-9\\.]+)" |
average_precision |
평균 정밀도 점수 | 최대화 | "average_precision: ([0-9\\.]+)" |
multi_logloss |
멀티클래스 교차 엔트로피 | 최대화 | "multi_logloss: ([0-9\\.]+)" |
multi_error |
다중 클래스 오류 점수 | 최소화 | "multi_error: ([0-9\\.]+)" |
auc_mu |
AUC-MU | 최대화 | "auc_mu: ([0-9\\.]+)" |
cross_entropy |
교차 엔트로피 | 최소화 | "cross_entropy: ([0-9\\.]+)" |
튜닝 가능한 LightGBM 하이퍼파라미터
다음 하이퍼파라미터를 사용하여 LightGBM 모델을 튜닝합니다. LightGBM 평가 지표를 최적화하는데 가장 큰 영향을 미치는 하이퍼파라미터는 learning_rate
, num_leaves
, feature_fraction
, bagging_fraction
, bagging_freq
, max_depth
, min_data_in_leaf
입니다. 모든 LightGbm 하이퍼파라미터 목록은 라이트GBM 하이퍼파라미터 섹션을 참조하세요.
파라미터 이름 | 파라미터 유형 | 권장 범위 |
---|---|---|
learning_rate |
ContinuousParameterRanges | MinValue: 0.001, MaxValue: 0.01 |
num_leaves |
IntegerParameterRanges | MinValue: 10, MaxValue: 100 |
feature_fraction |
ContinuousParameterRanges | MinValue: 0.1, MaxValue: 1.0 |
bagging_fraction |
ContinuousParameterRanges | MinValue: 0.1, MaxValue: 1.0 |
bagging_freq |
IntegerParameterRanges | MinValue: 0, MaxValue: 10 |
max_depth |
IntegerParameterRanges | MinValue: 15, MaxValue: 100 |
min_data_in_leaf |
IntegerParameterRanges | MinValue: 10, MaxValue: 200 |