SageMaker Autopilot

포커스 모드

SageMaker Autopilot - Amazon SageMaker AI

중요

2023년 11월 30일부터 Autopilot의 UI는 업데이트된 Amazon SageMaker Studio 환경의 일부로 Amazon SageMaker Canvas로 마이그레이션됩니다. SageMaker Canvas는 분석가 및 시민 데이터 과학자에게 데이터 준비, 기능 엔지니어링, 알고리즘 선택, 훈련 및 튜닝, 추론 등과 같은 작업에 대한 코드 없는 기능을 제공합니다. 사용자는 내장된 시각화 및 what-if 분석을 활용하여 자동화된 예측을 통해 모델을 쉽게 프로덕션화할 수 있으므로 데이터와 다양한 시나리오를 탐색할 수 있습니다. Canvas는 컴퓨터 비전, 수요 예측, 지능형 검색 및 생성형 AI를 비롯한 다양한 사용 사례를 지원합니다.

Studio의 이전 경험인 Amazon SageMaker Studio Classic 사용자는 Studio Classic에서 Autopilot UI를 계속 사용할 수 있습니다. 코딩 경험이 있는 사용자는 기술 구현을 위해 지원되는 모든 SDK에서 모든 API 참조를 계속 사용할 수 있습니다.

지금까지 Studio Classic에서 Autopilot을 사용하고 있고 SageMaker Canvas로 마이그레이션하려는 경우 SageMaker Canvas 애플리케이션을 생성하고 사용할 수 있도록 사용자 프로필 또는 IAM 역할에 추가 권한을 부여해야 할 수 있습니다. 자세한 내용은 (선택 사항) Studio Classic의 Autopilot에서 SageMaker Canvas로 마이그레이션 섹션을 참조하세요.

이 안내서의 모든 UI 관련 지침은 Amazon SageMaker Canvas 로 마이그레이션하기 전에 Autopilot의 독립 실행형 기능과 관련이 있습니다. 이 지침을 따르는 사용자는 Studio Classic을 사용해야 합니다.

Amazon SageMaker Autopilot은 기계 학습 모델(AutoML)을 빌드하고 배포하는 프로세스를 자동화함으로써 기계 학습 워크플로의 다양한 단계를 간소화하고 가속화하는 기능 세트입니다. 다음 페이지에서는 Amazon SageMaker Autopilot에 대한 주요 정보를 설명합니다.

Autopilot은 오토파일럿으로 사용하거나 다양한 수준의 인간 지침에 따라 사용할 수 있는 주요 작업을 다음과 같이 수행합니다.

데이터 분석 및 사전 처리: Autopilot은 특정 문제 유형을 식별하고, 누락된 값을 처리하고, 데이터를 정규화하고, 기능을 선택하고, 모델 훈련에 사용할 데이터를 전체적으로 준비합니다.
모델 선택: Autopilot은 다양한 알고리즘을 탐색하고 교차 검증 리샘플링 기법을 사용하여 사전 정의된 객관적 지표를 기준으로 알고리즘의 예측 품질을 평가할 지표를 생성합니다.
하이퍼파라미터 최적화: Autopilot은 최적의 하이퍼파라미터 구성 검색을 자동화합니다.
모델 훈련 및 평가: Autopilot은 다양한 모델 후보의 훈련 및 평가 프로세스를 자동화합니다. 또한 데이터를 훈련 세트 및 검증 세트로 분할하고, 훈련 데이터를 이용하여 선택된 모델 후보를 훈련시키며, 검증 세트의 보이지 않는 데이터에 대한 성능을 평가합니다. 마지막으로 성능에 따라 최적화된 모델 후보의 순위를 매기고, 성능이 가장 좋은 모델을 식별합니다.
모델 배포: Autopilot이 성능이 가장 좋은 모델을 식별하고 나면, API를 노출하는 모델 아티팩트 및 엔드포인트를 생성하여 모델을 자동 배포할 수 있는 옵션을 제공합니다. 외부 애플리케이션은 이 엔드포인트로 데이터를 전송하고 해당 예측 또는 추론을 수신할 수 있습니다.

Autopilot은 최대 수백 GB의 대규모 데이터세트로 기계 학습 모델을 빌드할 수 있도록 지원합니다.

다음 다이어그램은 Autopilot으로 관리되는 이 AutoML 프로세스의 작업을 요약한 내용입니다.

Amazon SageMaker Autopilot AutoML 프로세스의 개요.

기계 학습 프로세스에 대한 숙련도 및 코딩 경험에 따라 Autopilot을 다음과 같이 다양한 방식으로 사용할 수 있습니다.

Studio Classic UI를 사용하면 사용자는 코드 없는 환경 중에서 선택하거나 일정 수준의 인적 입력이 있을 수 있습니다.

참고
회귀 또는 분류 등의 문제 유형에 대한 표 형식 데이터로 생성한 실험만 Studio Classic UI를 통해 사용할 수 있습니다.
AutoML API를 사용하면 코딩 경험이 있는 사용자가 사용 가능한 SDKs 사용하여 AutoML 작업을 생성할 수 있습니다. 이 접근 방식은 유연성과 사용자 지정 옵션을 높이고 모든 문제 유형에 사용할 수 있습니다.

Autopilot은 현재 다음의 문제 유형을 지원합니다.

참고

표 형식 데이터와 관련 있는 회귀 또는 분류 문제의 경우 사용자는 2가지 옵션, 즉 Studio Classic 사용자 인터페이스 또는 API 참조 중 하나를 선택할 수 있습니다.

텍스트 및 이미지 분류, 시계열 예측, 대형 언어 모델 미세 조정과 같은 작업은 2 버전의 AutoML REST API를 통해서만 사용할 수 있습니다. 선택한 언어가 Python인 경우 Amazon SageMaker Python SDK의 AWS SDK for Python (Boto3) 또는 AutoMLV2 객체를 직접 참조할 수 있습니다.

편리한 사용자 인터페이스를 선호하는 사용자는 Amazon SageMaker Canvas를 사용하여 사전 훈련된 모델, 생성형 AI 기반 모델에 액세스하거나 특정 텍스트, 이미지 분류 또는 예측 요구 또는 생성형 AI에 맞춘 사용자 지정 모델을 생성할 수 있습니다.

회귀, 바이너리 및 멀티클래스 분류 CSV 파일 또는 Parquet 파일 형식의 표 형식 데이터를 사용합니다. 여기서 각 열에는 특정 데이터 유형을 갖춘 특성이 포함되고, 각 행에는 관측치가 포함됩니다. 허용되는 열 데이터 유형에는 쉼표로 구분된 숫자의 문자열로 구성된 숫자열, 범주열, 텍스트열 및 시계열이 포함됩니다.
- SageMaker API 참조를 사용하여 Autopilot 작업을 파일럿 실험으로 만들려면 AutoML API를 사용하여 테이블 형식 데이터에 대한 회귀 또는 분류 작업 생성 섹션을 참조하세요.
- Studio UI를 사용하여 Autopilot 작업을 파일럿 실험으로 만들려면 Studio Classic UI를 사용하여 테이블 형식 데이터에 대한 회귀 또는 분류 Autopilot 실험 생성 섹션을 참조하세요.
- Studio Classic UI에서 Autopilot 실험의 기본 인프라, 네트워킹 또는 보안 파라미터를 사전 구성하려는 관리자는 Autopilot 실험의 기본 파라미터 구성하기(관리자용) 섹션을 참조하세요.
텍스트 분류 CSV 파일 또는 Parquet 파일 형식의 데이터를 사용합니다. 한 열에서는 분류해야 할 문장을 제공하고, 다른 열에서는 해당 클래스 레이블을 제공합니다. API를 사용하여 텍스트 분류를 위한 AutoML 작업 생성을 참조하세요.
PNG, JPEG 같은 이미지 형식 또는 이 둘을 합친 형식을 이용한 이미지 분류. AutoML API를 사용하여 이미지 분류 작업 생성 섹션을 참조하세요.
CSV 파일 또는 Parquet 파일 형식의 시계열 예측. API를 사용하여 시계열 예측을 위한 AutoML 작업 생성 섹션을 참조하세요.
CSV 파일 또는 Parquet 파일 형식의 데이터를 이용한 텍스트 생성 대규모 언어 모델(LLM) 미세 조정. API를 사용하여 텍스트 생성 모델을 미세 조정하는 AutoML 작업 생성 섹션을 참조하세요.

또한 Autopilot은 각 개별 기능의 중요성을 보여주는 보고서를 자동 생성하여, 사용자가 모델의 예측 수행 방식을 이해할 수 있도록 도와 줍니다. 이로써 예측에 영향을 미치는 요인에 대한 명료성과 통찰력을 얻을 수 있습니다. 이러한 명료성과 통찰력은 위험 팀 및 규정 준수 팀과 외부 규제 기관에서 사용할 수 있습니다. 뿐만 아니라 Autopilot은 평가 지표 요약, 혼동 행렬, 다양한 시각화(예: 수신기 작동 특성 곡선, 정밀 재현률 곡선 등)를 포함하는 모델 성능 보고서도 제공합니다. 각 보고서의 구체적인 내용은 Autopilot 실험의 문제 유형에 따라 달라집니다.

Autopilot 환경에서 가장 적합한 모델 후보에 대한 설명 가능성 및 성능 보고서는 텍스트, 이미지 및 테이블 형식 데이터 분류 문제 유형에 대해 사용할 수 있습니다.

Autopilot은 회귀 또는 분류 등 표 형식 데이터 사용 사례에 대해 데이터를 탐색하고 성능이 가장 좋은 모델을 찾는 데 사용할 코드가 포함된 노트북을 생성하여, 데이터 정렬 방식 및 모델 후보를 선택, 훈련 및 튜닝한 방법을 추가적으로 시각화합니다. 이 노트북들은 다양한 입력의 영향이나 여러 실험에서 이루어진 균형을 파악하는 데 도움이 될 대화형 탐색 환경을 제공합니다. Autopilot에서 제공하는 데이터 탐색 노트북 및 후보 정의 노트북을 직접 수정하여 더 우수한 성능의 모델 후보를 계속 실험해 볼 수 있습니다.

Amazon SageMaker AI를 사용하면 사용한 만큼만 비용을 지불하면 됩니다. 사용량에 따라 SageMaker AI 또는 기타 AWS 서비스 내의 기본 컴퓨팅 및 스토리지 리소스에 대한 비용을 지불합니다. SageMaker AI 사용 비용에 대한 자세한 내용은 Amazon SageMaker AI 요금을 참조하세요.

주제

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

자동화된 ML, 코드 없음 또는 코드 적음

AutoML API를 사용하여 회귀 또는 분류 작업 생성

쿠키 기본 설정 선택

쿠키 기본 설정 사용자 지정

필수

성능

기능

광고

쿠키 기본 설정을 저장할 수 없음

SageMaker Autopilot

중요

참고

참고

주제

Related resources

페이지 내용이 도움이 되었습니까?

Related resources

다음 주제:

이전 주제:

도움이 필요하십니까?

Amazon SageMaker Autopilot AutoML 프로세스의 개요.