감독되지 않은 내장 알고리즘 SageMaker - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

감독되지 않은 내장 알고리즘 SageMaker

SageMaker Amazon은 클러스터링, 차원 축소, 패턴 인식 및 이상 탐지와 같은 다양한 비지도 학습 작업에 사용할 수 있는 여러 내장 알고리즘을 제공합니다.

  • IP Insights - IPv4 주소의 사용 패턴을 학습합니다. IPv4 주소와 여러 엔터티(예: 사용자 ID 또는 계정 번호) 간 연결을 캡처하도록 설계되어 있습니다.

  • k-means 알고리즘 - 데이터 내 별도의 그룹화를 찾습니다. 이 경우 그룹의 멤버는 가급적 다른 멤버와 유사하고 다른 그룹의 멤버와는 가급적 다릅니다.

  • 주성분 분석 (PCA) 알고리즘 - 처음 몇 개의 주요 구성 요소에 데이터 포인트를 프로젝션하여 데이터 세트 내의 차원(특성 수)을 줄입니다. 목표는 가능한 한 많은 정보나 변형을 유지하는 것입니다. 수학자의 경우 주요 구성 요소은 데이터 공분산 행렬의 고유벡터입니다.

  • 랜덤 컷 포리스트(RCF) 알고리즘 - 데이터 세트 내에서 제대로 구조화되거나 패턴이 있는 데이터와 다른 비정상적인 데이터 포인트를 탐지합니다.

알고리즘 이름 채널 이름 훈련 입력 모드 파일 유형 인스턴스 클래스 병렬화 가능
IP Insights 훈련 및 (선택적으로) 검증 파일 CSV CPU 또는 GPU
K-Means train 및 (선택 사항) test 파일 또는 파이프 recordIO-protobuf 또는 CSV CPU 또는 GPUCommon(하나 이상의 인스턴스에 대한 단일 GPU 디바이스) 아니요
PCA train 및 (선택 사항) test 파일 또는 파이프 recordIO-protobuf 또는 CSV GPU 또는 CPU
Random Cut Forest train 및 (선택 사항) test 파일 또는 파이프 recordIO-protobuf 또는 CSV CPU