기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker Autopilot
중요
2023년 11월 30일부터 Autopilot의 UI는 업데이트된 Amazon Studio 경험의 일환으로 Amazon SageMaker Canvas로 마이그레이션됩니다. SageMaker Canvas는 분석가 및 시민 데이터 과학자에게 데이터 준비, 기능 엔지니어링, 알고리즘 선택, 훈련 및 튜닝, 추론 등과 같은 작업에 대한 코드 없는 기능을 제공합니다. SageMaker 사용자는 내장된 시각화 및 what-if 분석을 활용하여 자동화된 예측을 통해 모델을 쉽게 프로덕션화할 수 있으므로 데이터와 다양한 시나리오를 탐색할 수 있습니다. Canvas는 컴퓨터 비전, 수요 예측, 지능형 검색 및 생성형 AI를 비롯한 다양한 사용 사례를 지원합니다.
Studio 의 이전 경험인 Amazon SageMaker Studio Classic 의 사용자는 Studio Classic에서 Autopilot UI를 계속 사용할 수 있습니다. 코딩 경험이 있는 사용자는 기술 구현SDK에 지원되는 모든 에서 모든 API 참조를 계속 사용할 수 있습니다.
지금까지 Studio Classic에서 Autopilot을 사용하고 Canvas로 마이그레이션하려는 경우 SageMaker Canvas SageMaker 애플리케이션을 생성하고 사용할 수 있도록 사용자 프로필 또는 IAM 역할에 추가 권한을 부여해야 할 수 있습니다. 자세한 내용은 (선택 사항) Studio Classic의 Autopilot에서 SageMaker Canvas로 마이그레이션 단원을 참조하십시오.
이 안내서의 모든 UI 관련 지침은 Amazon SageMaker Canvas 로 마이그레이션하기 전에 Autopilot의 독립 실행형 기능에 관한 것입니다. 이 지침을 따르는 사용자는 Studio Classic 을 사용해야 합니다.
Amazon SageMaker Autopilot은 기계 학습 모델(AutoML)을 구축하고 배포하는 프로세스를 자동화하여 기계 학습 워크플로의 다양한 단계를 간소화하고 가속화하는 기능 세트입니다. 다음 페이지에서는 Amazon SageMaker Autopilot에 대한 주요 정보를 설명합니다.
Autopilot은 Autopilot에서 또는 다양한 수준의 인적 지침에 따라 사용할 수 있는 다음과 같은 주요 작업을 수행합니다.
-
데이터 분석 및 사전 처리: Autopilot은 특정 문제 유형을 식별하고, 누락된 값을 처리하고, 데이터를 정규화하고, 기능을 선택하고, 모델 훈련에 사용할 데이터를 전체적으로 준비합니다.
-
모델 선택: Autopilot은 다양한 알고리즘을 탐색하고 교차 검증 리샘플링 기법을 사용하여 사전 정의된 객관적 지표를 기준으로 알고리즘의 예측 품질을 평가할 지표를 생성합니다.
-
하이퍼파라미터 최적화: Autopilot은 최적의 하이퍼파라미터 구성을 자동으로 검색합니다.
-
모델 훈련 및 평가: Autopilot은 다양한 모델 후보를 훈련하고 평가하는 프로세스를 자동화합니다. 또한 데이터를 훈련 세트 및 검증 세트로 분할하고, 훈련 데이터를 이용하여 선택된 모델 후보를 훈련시키며, 검증 세트의 보이지 않는 데이터에 대한 성능을 평가합니다. 마지막으로 성능에 따라 최적화된 모델 후보의 순위를 매기고, 성능이 가장 좋은 모델을 식별합니다.
-
모델 배포: Autopilot이 가장 성능이 좋은 모델을 식별하면 모델 아티팩트와 엔드포인트를 생성하여 를 노출하여 모델을 자동으로 배포할 수 있는 옵션을 제공합니다API. 외부 애플리케이션은 이 엔드포인트로 데이터를 전송하고 해당 예측 또는 추론을 수신할 수 있습니다.
Autopilot은 최대 수백 개의 대규모 데이터 세트에서 기계 학습 모델 구축을 지원합니다GBs.
다음 다이어그램은 Autopilot에서 관리하는 이 AutoML 프로세스의 작업을 간략하게 설명합니다.
기계 학습 프로세스에 대한 숙련도 및 코딩 경험에 따라 Autopilot을 다음과 같이 다양한 방식으로 사용할 수 있습니다.
-
Studio Classic UI 를 사용하면 사용자는 코드 없는 환경 중에서 선택하거나 일정 수준의 인적 입력이 있을 수 있습니다.
참고
회귀 또는 분류와 같은 문제 유형에 대한 테이블 형식 데이터에서 생성된 실험만 Studio Classic UI를 통해 사용할 수 있습니다.
-
AutoML 을 사용하면 API코딩 경험이 있는 사용자가 사용 가능한 SDKs를 사용하여 AutoML 작업을 생성할 수 있습니다. 이 접근 방식은 유연성과 사용자 지정 옵션을 높이고 모든 문제 유형에 사용할 수 있습니다.
Autopilot은 현재 다음의 문제 유형을 지원합니다.
참고
테이블 형식 데이터와 관련된 회귀 또는 분류 문제의 경우 사용자는 Studio Classic 사용자 인터페이스 또는 API 참조 의 두 옵션 중에서 선택할 수 있습니다.
텍스트 및 이미지 분류, 시계열 예측, 대규모 언어 모델의 미세 조정과 같은 작업은 AutoML 버전 2에서만 사용할 수 있습니다RESTAPI. 선택한 언어가 Python인 경우 Amazon SageMaker Python의 AWS SDK for Python (Boto3)
사용자 인터페이스의 편의성을 선호하는 사용자는 Amazon SageMaker Canvas를 사용하여 사전 훈련된 모델 및 생성형 AI 파운데이션 모델에 액세스하거나 특정 텍스트, 이미지 분류, 예측 요구 사항 또는 생성형 AI에 맞게 사용자 지정 모델을 생성할 수 있습니다.
-
CSV 또는 Parquet 파일 형식의 테이블 형식 데이터를 사용한 회귀, 바이너리 및 멀티클래스 분류로, 각 열에는 특정 데이터 형식의 기능이 포함되어 있고 각 행에는 관측값이 포함되어 있습니다. 허용되는 열 데이터 유형에는 쉼표로 구분된 숫자의 문자열로 구성된 숫자열, 범주열, 텍스트열 및 시계열이 포함됩니다.
-
참조를 사용하여 Autopilot 작업을 파일럿 실험으로 생성하려면 섹션을 참조하세요 SageMaker APIAutoML을 사용하여 테이블 형식 데이터에 대한 회귀 또는 분류 작업 생성 API.
-
Studio Classic UI를 사용하여 Autopilot 작업을 파일럿 실험으로 생성하려면 섹션을 참조하세요Studio Classic UI를 사용하여 표 형식 데이터에 대한 회귀 또는 분류 오토파일럿 실험 만들기.
-
Studio Classic UI에서 Autopilot 실험의 기본 인프라, 네트워킹 또는 보안 파라미터를 사전 구성하려는 관리자는 섹션을 참조하세요Autopilot 실험의 기본 파라미터 구성하기(관리자용).
-
-
CSV 또는 Parquet 파일 형식의 데이터를 사용한 텍스트 분류로, 열은 분류할 문장을 제공하는 반면 다른 열은 해당 클래스 레이블을 제공해야 합니다. 를 사용하여 텍스트 분류를 위한 AutoML 작업 생성 API을 참조하세요.
-
PNG, JPEG또는 두 형식의 조합과 같은 이미지 형식을 사용한 이미지 분류입니다. 단원을 참조하세요AutoML을 사용하여 이미지 분류 작업 생성 API.
-
또는 CSV Parquet 파일 형식의 시계열 데이터를 사용한 시계열 예측을 참조하세요를 사용하여 시계열 예측을 위한 AutoML 작업 생성 API.
-
CSV 또는 Parquet 파일 형식의 데이터를 사용하여 텍스트 생성을 위한 대규모 언어 모델(LLMs)을 미세 조정합니다. 단원을 참조하세요를 사용하여 텍스트 생성 모델을 미세 조정하는 AutoML 작업 생성 API.
또한 Autopilot은 각 개별 기능의 중요성을 보여주는 보고서를 자동 생성하여, 사용자가 모델의 예측 수행 방식을 이해할 수 있도록 도와 줍니다. 이로써 예측에 영향을 미치는 요인에 대한 명료성과 통찰력을 얻을 수 있습니다. 이러한 명료성과 통찰력은 위험 팀 및 규정 준수 팀과 외부 규제 기관에서 사용할 수 있습니다. 뿐만 아니라 Autopilot은 평가 지표 요약, 혼동 행렬, 다양한 시각화(예: 수신기 작동 특성 곡선, 정밀 재현률 곡선 등)를 포함하는 모델 성능 보고서도 제공합니다. 각 보고서의 구체적인 내용은 Autopilot 실험의 문제 유형에 따라 달라집니다.
Autopilot 실험에서 최상의 모델 후보에 대한 설명 가능성 및 성능 보고서는 텍스트, 이미지 및 테이블 형식의 데이터 분류 문제 유형에 사용할 수 있습니다.
회귀 또는 분류와 같은 표 형식의 데이터 사용 사례의 경우 Autopilot은 데이터를 탐색하고 가장 성능이 좋은 모델을 찾는 데 사용되는 코드가 포함된 노트북을 생성하여 데이터가 어떻게 랭글링되고 모델 후보가 어떻게 선택, 훈련 및 조정되었는지에 대한 추가 가시성을 제공합니다. 이 노트북들은 다양한 입력의 영향이나 여러 실험에서 이루어진 균형을 파악하는 데 도움이 될 대화형 탐색 환경을 제공합니다. Autopilot에서 제공하는 데이터 탐색 노트북 및 후보 정의 노트북을 직접 수정하여 더 우수한 성능의 모델 후보를 계속 실험해 볼 수 있습니다.
Amazon 에서는 사용한 금액만 SageMaker지불합니다. 사용량에 따라 SageMaker 또는 기타 AWS 서비스 내의 기본 컴퓨팅 및 스토리지 리소스에 대한 비용을 지불합니다. 사용 비용에 대한 자세한 내용은 Amazon SageMaker 요금 섹션을
주제
- AutoML을 사용하여 테이블 형식 데이터에 대한 회귀 또는 분류 작업 생성 API
- AutoML을 사용하여 이미지 분류 작업 생성 API
- 를 사용하여 텍스트 분류를 위한 AutoML 작업 생성 API
- 를 사용하여 시계열 예측을 위한 AutoML 작업 생성 API
- 를 사용하여 텍스트 생성 모델을 미세 조정하는 AutoML 작업 생성 API
- Studio Classic UI를 사용하여 표 형식 데이터에 대한 회귀 또는 분류 오토파일럿 실험 만들기
- Amazon SageMaker Autopilot 예제 노트북
- 비디오: Autopilot을 사용한 기계 학습 프로세스 자동화 및 탐색
- 자습서: Amazon SageMaker Autopilot 시작하기
- Autopilot 할당량
- API Autopilot 참조 가이드