LightGBM 모델을 튜닝하세요. - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

LightGBM 모델을 튜닝하세요.

자동 모델 튜닝은 하이퍼파라미터 튜닝이라고도 하며, 훈련 데이터세트 및 검증 데이터세트에 대한 다양한 하이퍼파라미터를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾는 기능입니다. 모델 튜닝은 다음과 같은 하이퍼파라미터에 초점을 맞춥니다.

참고

훈련 목표 함수는 레이블 열의 고유 정수 수에 따라 결정되는 분류 작업 유형에 따라 자동으로 할당됩니다. 자세한 내용은 라이트GBM 하이퍼파라미터 섹션을 참조하세요.

  • 모델 훈련 중에 최적화하기 위한 학습 목표 함수

  • 검증 중에 모델 성능을 평가하는 데 사용되는 평가 지표

  • 모델을 자동으로 튜닝할 때 사용하기 쉬운 하이퍼파라미터 세트와 일정한 범위의 값

자동 모델 튜닝은 지정된 하이퍼파라미터를 검색하여 선택한 평가 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다.

참고

LightGBM에 대한 자동 모델 튜닝은 Amazon SageMaker SageMaker AI SDKs에서만 사용할 수 있습니다.

모델 튜닝에 대한 추가 정보는 SageMaker AI를 사용한 자동 모델 튜닝 섹션을 참조하세요.

LightGBM 알고리즘으로 계산되는 평가 지표

SageMaker AI LightGBM 알고리즘은 모델 검증에 사용할 다음 지표를 계산합니다. 평가 지표는 분류 작업 유형(레이블 열에 표시된 고유 정수의 개수로 결정됨)에 따라 자동으로 할당됩니다.

지표 이름 설명 최적화 방향 정규식 패턴
rmse 평균 제곱근 오차 최소화 "rmse: ([0-9\\.]+)"
l1 평균 절대 오차 최소화 "l1: ([0-9\\.]+)"
l2 평균 제곱 오차 최소화 "l2: ([0-9\\.]+)"
huber Huber 손실 최소화 "huber: ([0-9\\.]+)"
fair 공정 손실 최소화 "fair: ([0-9\\.]+)"
binary_logloss 바이너리 크로스 엔트로피 최대화 "binary_logloss: ([0-9\\.]+)"
binary_error 바이너리 오류 최소화 "binary_error: ([0-9\\.]+)"
auc AUC 최대화 "auc: ([0-9\\.]+)"
average_precision 평균 정밀도 점수 최대화 "average_precision: ([0-9\\.]+)"
multi_logloss 멀티클래스 교차 엔트로피 최대화 "multi_logloss: ([0-9\\.]+)"
multi_error 다중 클래스 오류 점수 최소화 "multi_error: ([0-9\\.]+)"
auc_mu AUC-MU 최대화 "auc_mu: ([0-9\\.]+)"
cross_entropy 교차 엔트로피 최소화 "cross_entropy: ([0-9\\.]+)"

튜닝 가능한 LightGBM 하이퍼파라미터

다음 하이퍼파라미터를 사용하여 LightGBM 모델을 튜닝합니다. LightGBM 평가 지표를 최적화하는데 가장 큰 영향을 미치는 하이퍼파라미터는 learning_rate, num_leaves, feature_fraction, bagging_fraction, bagging_freq, max_depth, min_data_in_leaf입니다. 모든 LightGbm 하이퍼파라미터 목록은 라이트GBM 하이퍼파라미터 섹션을 참조하세요.

파라미터 이름 파라미터 유형 권장 범위
learning_rate ContinuousParameterRanges MinValue: 0.001, MaxValue: 0.01
num_leaves IntegerParameterRanges MinValue: 10, MaxValue: 100
feature_fraction ContinuousParameterRanges MinValue: 0.1, MaxValue: 1.0
bagging_fraction ContinuousParameterRanges MinValue: 0.1, MaxValue: 1.0
bagging_freq IntegerParameterRanges MinValue: 0, MaxValue: 10
max_depth IntegerParameterRanges MinValue: 15, MaxValue: 100
min_data_in_leaf IntegerParameterRanges MinValue: 10, MaxValue: 200