CatBoost - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

CatBoost

CatBoost는 Gradient Boosting Decision Tree(GBDT) 알고리즘의 인기 있는 고성능 오픈 소스 구현입니다. GBDT는 더 단순하고 약한 모델 세트의 추정치 앙상블을 결합하여 대상 변수를 정확하게 예측하려고 시도하는 감독 학습 알고리즘입니다.

CatBoost 는 GBDT에 두 가지 중요한 알고리즘 발전을 도입했습니다.

  1. 기존 알고리즘에 대한 순열 기반 대안인 순서가 있는 부스팅 구현

  2. 범주형 기능을 처리하기 위한 혁신적인 알고리즘

두 기법 모두 현재의 모든 기존 그라데이션 부스팅 알고리즘 구현에 존재하는 특수한 종류의 표적 누출로 인한 예측 변화를 막기 위해 개발되었습니다. 이 페이지에는 Amazon EC2 인스턴스 권장 사항 및 샘플 노트북에 대한 정보가 포함되어 있습니다 CatBoost.

알고리즘에 CatBoost 대한 Amazon EC2 인스턴스 권장 사항

SageMaker AI는 CatBoost 현재 만 사용하여 훈련합니다CPUs. CatBoost 는 메모리 바운드(컴퓨트 바운드가 아닌) 알고리즘입니다. 따라서 컴퓨팅 최적화 인스턴스(예: C5)보다 범용 컴퓨팅 인스턴스(예: M5)를 선택하는 것이 좋습니다. 또한 훈련 데이터를 보유하기 위해 선택한 인스턴스에 총 메모리가 충분한 것이 좋습니다.

CatBoost 샘플 노트북

다음 표에는 Amazon SageMaker AI CatBoost 알고리즘의 다양한 사용 사례를 해결하는 다양한 샘플 노트북이 요약되어 있습니다.

노트북 제목 설명

Amazon SageMaker AI LightGBM 및 CatBoost 알고리즘을 사용한 테이블 분류

이 노트북은 Amazon SageMaker AI CatBoost 알고리즘을 사용하여 테이블 형식 분류 모델을 훈련하고 호스팅하는 방법을 보여줍니다.

Amazon SageMaker AI LightGBM 및 CatBoost 알고리즘을 사용한 테이블 형식 회귀

이 노트북은 Amazon SageMaker AI CatBoost 알고리즘을 사용하여 테이블 형식 회귀 모델을 훈련하고 호스팅하는 방법을 보여줍니다.

SageMaker AI에서 예제를 실행하는 데 사용할 수 있는 Jupyter 노트북 인스턴스를 생성하고 액세스하는 방법에 대한 지침은 섹션을 참조하세요Amazon SageMaker 노트북 인스턴스. 노트북 인스턴스를 생성하고 연 후 SageMaker AI 예제 탭을 선택하여 모든 SageMaker AI 샘플 목록을 확인합니다. 노트북을 열려면 사용 탭을 선택한 후 사본 생성을 선택합니다.