기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
테이블 형식 SageMaker 데이터를 위한 내장 알고리즘
SageMaker Amazon은 표 형식 데이터 분석에 맞게 조정된 내장 알고리즘을 제공합니다. 테이블 형식 데이터는 행(관측치)과 열(특징)로 구성된 테이블로 이루어진 모든 데이터 세트를 의미합니다. 표 형식 데이터에 대한 내장 SageMaker 알고리즘을 분류 또는 회귀 문제에 사용할 수 있습니다.
-
AutoGluon- 테이블 형식 - 모델을 앙상블하고 여러 레이어로 쌓아 승계하는 오픈 소스 AutoML 프레임워크.
-
CatBoost - 그라디언트 부스트 트리 알고리즘의 구현으로, 순서가 있는 부스팅과 범주형 특성 처리를 위한 혁신적인 알고리즘의 구현.
-
Factorization Machine 알고리즘 - 고차원 저밀도 데이터 세트 내 특성 간 상호 작용을 경제적으로 캡처하도록 설계된 선형 모델의 확장.
-
K-Nearest Neighbors(k-NN) 알고리즘 - 레이블이 지정된 가장 가까운 k개의 포인트를 사용하여 분류할 새 데이터 포인트에 레이블을 할당하거나 회귀를 위해 가장 가까운 k개의 포인트 평균을 바탕으로 예측된 대상 값을 지정하는 비모수적 방법.
-
라이트GBM - 효율성과 확장성을 개선하기 위한 두 가지 새로운 기법인 그라디언트 기반 단측 샘플링(GOSS)과 배타적 특성 번들링(EFB)이 추가된 그라디언트 부스트 트리 알고리즘의 구현.
-
선형 학습자 알고리즘 - 회귀를 위한 선형 함수 또는 분류를 위한 선형 임계값 함수를 학습합니다.
-
TabTransformer—트랜스포머에 구축된 새로운 딥 테이블 형식 데이터 모델링 아키텍처. self-attention-based
-
XGBoost Amazon 알고리즘 SageMaker - 더 간단하고 약한 모델 세트의 예상치 앙상블을 결합하는 그라디언트 부스트 트리 알고리즘의 구현.
알고리즘 이름 | 채널 이름 | 훈련 입력 모드 | 파일 유형 | 인스턴스 클래스 | 병렬화 가능 |
---|---|---|---|---|---|
AutoGluon-표 형식 | 훈련 및 (선택적으로) 검증 | 파일 | CSV | CPU 또는 GPU(단일 인스턴스 전용) | 아니요 |
CatBoost | 훈련 및 (선택적으로) 검증 | 파일 | CSV | CPU(단일 인스턴스 전용) | 아니요 |
Factorization Machines | train 및 (선택 사항) test | 파일 또는 파이프 | recordIO-protobuf | CPU(밀집 데이터의 경우 GPU) | 예 |
K-Nearest-Neighbors(k-NN) | train 및 (선택 사항) test | 파일 또는 파이프 | recordIO-protobuf 또는 CSV | CPU 또는 GPU(하나 이상의 인스턴스에 대한 단일 GPU 디바이스) | 예 |
LightGBM | 훈련 및 (선택적으로) 검증 | 파일 | CSV | CPU(단일 인스턴스 전용) | 아니요 |
Linear Learner | train 및 (선택 사항) validation, test 또는 모두 | 파일 또는 파이프 | recordIO-protobuf 또는 CSV | CPU 또는 GPU | 예 |
TabTransformer | 훈련 및 (선택적으로) 검증 | 파일 | CSV | CPU 또는 GPU(단일 인스턴스 전용) | 아니요 |
XGBoost(0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) | 훈련 및 (선택적으로) 검증 | 파일 또는 파이프 | CSV, LibSVM, Parquet | CPU(또는 1.2-1의 경우 GPU) | 예 |