CatBoost - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

CatBoost

CatBoost 는 Gradient Boosting Decision Tree(GBDT) 알고리즘의 인기 있는 고성능 오픈 소스 구현입니다. GBDT 는 더 단순하고 약한 모델 세트의 추정치 앙상블을 결합하여 대상 변수를 정확하게 예측하려고 시도하는 감독형 학습 알고리즘입니다.

CatBoost 는 에 두 가지 중요한 알고리즘 발전을 도입했습니다GBDT.

  1. 기존 알고리즘에 대한 순열 기반 대안인 순서가 있는 부스팅 구현

  2. 범주형 기능을 처리하기 위한 혁신적인 알고리즘

두 기법 모두 현재의 모든 기존 그라데이션 부스팅 알고리즘 구현에 존재하는 특수한 종류의 표적 누출로 인한 예측 변화를 막기 위해 개발되었습니다. 이 페이지에는 에 대한 Amazon EC2 인스턴스 권장 사항 및 샘플 노트북에 대한 정보가 포함되어 있습니다 CatBoost.

알고리즘에 CatBoost 대한 Amazon EC2 인스턴스 권장 사항

SageMaker CatBoost 현재는 만 사용하여 훈련합니다CPUs. CatBoost 는 메모리 바운드(컴퓨트 바운드가 아닌) 알고리즘입니다. 따라서 컴퓨팅 최적화 인스턴스(예: C5)보다 범용 컴퓨팅 인스턴스(예: M5)를 선택하는 것이 좋습니다. 또한 훈련 데이터를 보유하기 위해 선택한 인스턴스에 총 메모리가 충분한 것이 좋습니다.

CatBoost 샘플 노트북

다음 표에는 Amazon SageMaker CatBoost 알고리즘의 다양한 사용 사례를 다루는 다양한 샘플 노트북이 요약되어 있습니다.

노트북 제목 설명

Amazon SageMaker LightGBM 및 CatBoost 알고리즘을 사용한 테이블 분류

이 노트북은 Amazon SageMaker CatBoost 알고리즘을 사용하여 테이블 형식 분류 모델을 훈련하고 호스팅하는 방법을 보여줍니다.

Amazon SageMaker LightGBM 및 CatBoost 알고리즘을 사용한 테이블 형식 회귀

이 노트북은 Amazon SageMaker CatBoost 알고리즘을 사용하여 테이블 형식 회귀 모델을 훈련하고 호스팅하는 방법을 보여줍니다.

에서 예제를 실행하는 데 사용할 수 있는 Jupyter 노트북 인스턴스를 생성하고 액세스하는 방법에 대한 지침은 섹션을 SageMaker참조하세요Amazon SageMaker 노트북 인스턴스. 노트북 인스턴스를 생성하고 연 후 SageMaker 예제 탭을 선택하여 모든 SageMaker 샘플 목록을 확인합니다. 노트북을 열려면 사용 탭을 선택한 후 사본 생성을 선택합니다.