LightGBM - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

LightGBM

LightGBM은 그라디언트 부스팅 의사 결정 트리 알고리즘(GBDT)에서 유명하고 효율적인 오픈 소스 구현입니다. GBDT는 더욱 단순하고 약한 모델 세트의 추정치의 앙상블을 결합하여 대상 변수를 정확하게 예측하려 시도하는 지도 훈련 알고리즘입니다. LightGBM은 추가 기술을 사용하여 기존 GBDT의 효율성과 확장성을 크게 개선합니다. 이 페이지에는 Amazon EC2 인스턴스 권장 사항 및 LightGBM용 샘플 노트북에 대한 정보가 포함되어 있습니다.

LightGBM 알고리즘에 대한 Amazon EC2 인스턴스 권장 사항

SageMaker AI LightGBM은 현재 단일 인스턴스 및 다중 인스턴스 CPU 훈련을 지원합니다. 다중 인스턴스 CPU 훈련(분산 훈련)의 경우, 예측기를 정의할 때 1보다 큰 instance_count를 지정하세요 LightGBM을 사용한 분산 훈련에 대한 자세한 내용은 Dask를 사용한 Amazon SageMaker AI LightGBM 분산 훈련을 참조하세요.

LightGBM은 메모리 바운드(컴퓨팅 파운드와는 반대) 알고리즘입니다. 따라서 컴퓨팅 최적화 인스턴스(예: C5)보다 범용 컴퓨팅 인스턴스(예: M5)를 선택하는 것이 좋습니다. 또한 훈련 데이터를 보유하기 위해 선택한 인스턴스에 총 메모리가 충분한 것이 좋습니다.

LightGBM 샘플 노트북

다음 표에는 Amazon SageMaker AI LightGBM 알고리즘의 다양한 사용 사례를 해결하는 다양한 샘플 노트북이 요약되어 있습니다.

노트북 제목 설명

Amazon SageMaker AI LightGBM 및 CatBoost 알고리즘을 사용한 테이블 분류

이 노트북은 Amazon SageMaker AI LightGBM 알고리즘을 사용하여 테이블 형식 분류 모델을 훈련하고 호스팅하는 방법을 보여줍니다.

Amazon SageMaker AI LightGBM 및 CatBoost 알고리즘을 사용한 테이블 형식 회귀

이 노트북은 Amazon SageMaker AI LightGBM 알고리즘을 사용하여 테이블 형식 회귀 모델을 훈련하고 호스팅하는 방법을 보여줍니다.

Dask를 사용한 Amazon SageMaker AI LightGBM 분산 훈련

이 노트북은 Dask 프레임워크를 사용하는 Amazon SageMaker AI LightGBM 알고리즘을 사용한 분산 훈련을 보여줍니다.

SageMaker AI에서 예제를 실행하는 데 사용할 수 있는 Jupyter 노트북 인스턴스를 생성하고 액세스하는 방법에 대한 지침은 섹션을 참조하세요Amazon SageMaker 노트북 인스턴스. 노트북 인스턴스를 생성하고 연 후 SageMaker AI 예제 탭을 선택하여 모든 SageMaker AI 샘플 목록을 확인합니다. 노트북을 열려면 사용 탭을 선택한 후 사본 생성을 선택합니다.