테이블 형식 SageMaker 데이터를 위한 내장 알고리즘 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

테이블 형식 SageMaker 데이터를 위한 내장 알고리즘

SageMaker Amazon은 표 형식 데이터 분석에 맞게 조정된 내장 알고리즘을 제공합니다. 테이블 형식 데이터는 행(관측치)과 열(특징)로 구성된 테이블로 이루어진 모든 데이터 세트를 의미합니다. 표 형식 데이터에 대한 내장 SageMaker 알고리즘을 분류 또는 회귀 문제에 사용할 수 있습니다.

  • AutoGluon- 테이블 형식 - 모델을 앙상블하고 여러 레이어로 쌓아 승계하는 오픈 소스 AutoML 프레임워크.

  • CatBoost - 그라디언트 부스트 트리 알고리즘의 구현으로, 순서가 있는 부스팅과 범주형 특성 처리를 위한 혁신적인 알고리즘의 구현.

  • Factorization Machine 알고리즘 - 고차원 저밀도 데이터 세트 내 특성 간 상호 작용을 경제적으로 캡처하도록 설계된 선형 모델의 확장.

  • K-Nearest Neighbors(k-NN) 알고리즘 - 레이블이 지정된 가장 가까운 k개의 포인트를 사용하여 분류할 새 데이터 포인트에 레이블을 할당하거나 회귀를 위해 가장 가까운 k개의 포인트 평균을 바탕으로 예측된 대상 값을 지정하는 비모수적 방법.

  • 라이트GBM - 효율성과 확장성을 개선하기 위한 두 가지 새로운 기법인 그라디언트 기반 단측 샘플링(GOSS)과 배타적 특성 번들링(EFB)이 추가된 그라디언트 부스트 트리 알고리즘의 구현.

  • 선형 학습자 알고리즘 - 회귀를 위한 선형 함수 또는 분류를 위한 선형 임계값 함수를 학습합니다.

  • TabTransformer—트랜스포머에 구축된 새로운 딥 테이블 형식 데이터 모델링 아키텍처. self-attention-based

  • XGBoost Amazon 알고리즘 SageMaker - 더 간단하고 약한 모델 세트의 예상치 앙상블을 결합하는 그라디언트 부스트 트리 알고리즘의 구현.

알고리즘 이름 채널 이름 훈련 입력 모드 파일 유형 인스턴스 클래스 병렬화 가능
AutoGluon-표 형식 훈련 및 (선택적으로) 검증 파일 CSV CPU 또는 GPU(단일 인스턴스 전용) 아니요
CatBoost 훈련 및 (선택적으로) 검증 파일 CSV CPU(단일 인스턴스 전용) 아니요
Factorization Machines train 및 (선택 사항) test 파일 또는 파이프 recordIO-protobuf CPU(밀집 데이터의 경우 GPU)
K-Nearest-Neighbors(k-NN) train 및 (선택 사항) test 파일 또는 파이프 recordIO-protobuf 또는 CSV CPU 또는 GPU(하나 이상의 인스턴스에 대한 단일 GPU 디바이스)
LightGBM 훈련 및 (선택적으로) 검증 파일 CSV CPU(단일 인스턴스 전용) 아니요
Linear Learner train 및 (선택 사항) validation, test 또는 모두 파일 또는 파이프 recordIO-protobuf 또는 CSV CPU 또는 GPU
TabTransformer 훈련 및 (선택적으로) 검증 파일 CSV CPU 또는 GPU(단일 인스턴스 전용) 아니요
XGBoost(0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) 훈련 및 (선택적으로) 검증 파일 또는 파이프 CSV, LibSVM, Parquet CPU(또는 1.2-1의 경우 GPU)