SageMaker Autopilot - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker Autopilot

중요

2023년 11월 30일부터 Autopilot의 UI는 업데이트된 Amazon Studio 경험의 일환으로 Amazon SageMaker Canvas로 마이그레이션됩니다. SageMaker Canvas는 분석가 및 시민 데이터 과학자에게 데이터 준비, 기능 엔지니어링, 알고리즘 선택, 훈련 및 튜닝, 추론 등과 같은 작업에 대한 코드 없는 기능을 제공합니다. SageMaker 사용자는 내장된 시각화 및 what-if 분석을 활용하여 자동화된 예측을 통해 모델을 쉽게 프로덕션화할 수 있으므로 데이터와 다양한 시나리오를 탐색할 수 있습니다. Canvas는 컴퓨터 비전, 수요 예측, 지능형 검색 및 생성형 AI를 비롯한 다양한 사용 사례를 지원합니다.

Studio 의 이전 경험인 Amazon SageMaker Studio Classic 의 사용자는 Studio Classic에서 Autopilot UI를 계속 사용할 수 있습니다. 코딩 경험이 있는 사용자는 기술 구현SDK에 지원되는 모든 에서 모든 API 참조를 계속 사용할 수 있습니다.

지금까지 Studio Classic에서 Autopilot을 사용하고 Canvas로 마이그레이션하려는 경우 SageMaker Canvas SageMaker 애플리케이션을 생성하고 사용할 수 있도록 사용자 프로필 또는 IAM 역할에 추가 권한을 부여해야 할 수 있습니다. 자세한 내용은 (선택 사항) Studio Classic의 Autopilot에서 SageMaker Canvas로 마이그레이션 단원을 참조하십시오.

이 안내서의 모든 UI 관련 지침은 Amazon SageMaker Canvas 로 마이그레이션하기 전에 Autopilot의 독립 실행형 기능에 관한 것입니다. 이 지침을 따르는 사용자는 Studio Classic 을 사용해야 합니다.

Amazon SageMaker Autopilot은 기계 학습 모델(AutoML)을 구축하고 배포하는 프로세스를 자동화하여 기계 학습 워크플로의 다양한 단계를 간소화하고 가속화하는 기능 세트입니다. 다음 페이지에서는 Amazon SageMaker Autopilot에 대한 주요 정보를 설명합니다.

Autopilot은 Autopilot에서 또는 다양한 수준의 인적 지침에 따라 사용할 수 있는 다음과 같은 주요 작업을 수행합니다.

  • 데이터 분석 및 사전 처리: Autopilot은 특정 문제 유형을 식별하고, 누락된 값을 처리하고, 데이터를 정규화하고, 기능을 선택하고, 모델 훈련에 사용할 데이터를 전체적으로 준비합니다.

  • 모델 선택: Autopilot은 다양한 알고리즘을 탐색하고 교차 검증 리샘플링 기법을 사용하여 사전 정의된 객관적 지표를 기준으로 알고리즘의 예측 품질을 평가할 지표를 생성합니다.

  • 하이퍼파라미터 최적화: Autopilot은 최적의 하이퍼파라미터 구성을 자동으로 검색합니다.

  • 모델 훈련 및 평가: Autopilot은 다양한 모델 후보를 훈련하고 평가하는 프로세스를 자동화합니다. 또한 데이터를 훈련 세트 및 검증 세트로 분할하고, 훈련 데이터를 이용하여 선택된 모델 후보를 훈련시키며, 검증 세트의 보이지 않는 데이터에 대한 성능을 평가합니다. 마지막으로 성능에 따라 최적화된 모델 후보의 순위를 매기고, 성능이 가장 좋은 모델을 식별합니다.

  • 모델 배포: Autopilot이 가장 성능이 좋은 모델을 식별하면 모델 아티팩트와 엔드포인트를 생성하여 를 노출하여 모델을 자동으로 배포할 수 있는 옵션을 제공합니다API. 외부 애플리케이션은 이 엔드포인트로 데이터를 전송하고 해당 예측 또는 추론을 수신할 수 있습니다.

Autopilot은 최대 수백 개의 대규모 데이터 세트에서 기계 학습 모델 구축을 지원합니다GBs.

다음 다이어그램은 Autopilot에서 관리하는 이 AutoML 프로세스의 작업을 간략하게 설명합니다.

Amazon SageMaker Autopilot AutoML 프로세스 개요.

기계 학습 프로세스에 대한 숙련도 및 코딩 경험에 따라 Autopilot을 다음과 같이 다양한 방식으로 사용할 수 있습니다.

  • Studio Classic UI 를 사용하면 사용자는 코드 없는 환경 중에서 선택하거나 일정 수준의 인적 입력이 있을 수 있습니다.

    참고

    회귀 또는 분류와 같은 문제 유형에 대한 테이블 형식 데이터에서 생성된 실험만 Studio Classic UI를 통해 사용할 수 있습니다.

  • AutoML 을 사용하면 API코딩 경험이 있는 사용자가 사용 가능한 SDKs를 사용하여 AutoML 작업을 생성할 수 있습니다. 이 접근 방식은 유연성과 사용자 지정 옵션을 높이고 모든 문제 유형에 사용할 수 있습니다.

Autopilot은 현재 다음의 문제 유형을 지원합니다.

참고

테이블 형식 데이터와 관련된 회귀 또는 분류 문제의 경우 사용자는 Studio Classic 사용자 인터페이스 또는 API 참조 의 두 옵션 중에서 선택할 수 있습니다.

텍스트 및 이미지 분류, 시계열 예측, 대규모 언어 모델의 미세 조정과 같은 작업은 AutoML 버전 2에서만 사용할 수 있습니다RESTAPI. 선택한 언어가 Python인 경우 Amazon SageMaker Python의 AWS SDK for Python (Boto3) 또는 AutoMLV2 객체를 SDK 직접 참조할 수 있습니다.

사용자 인터페이스의 편의성을 선호하는 사용자는 Amazon SageMaker Canvas를 사용하여 사전 훈련된 모델 및 생성형 AI 파운데이션 모델에 액세스하거나 특정 텍스트, 이미지 분류, 예측 요구 사항 또는 생성형 AI에 맞게 사용자 지정 모델을 생성할 수 있습니다.

또한 Autopilot은 각 개별 기능의 중요성을 보여주는 보고서를 자동 생성하여, 사용자가 모델의 예측 수행 방식을 이해할 수 있도록 도와 줍니다. 이로써 예측에 영향을 미치는 요인에 대한 명료성과 통찰력을 얻을 수 있습니다. 이러한 명료성과 통찰력은 위험 팀 및 규정 준수 팀과 외부 규제 기관에서 사용할 수 있습니다. 뿐만 아니라 Autopilot은 평가 지표 요약, 혼동 행렬, 다양한 시각화(예: 수신기 작동 특성 곡선, 정밀 재현률 곡선 등)를 포함하는 모델 성능 보고서도 제공합니다. 각 보고서의 구체적인 내용은 Autopilot 실험의 문제 유형에 따라 달라집니다.

Autopilot 실험에서 최상의 모델 후보에 대한 설명 가능성 및 성능 보고서는 텍스트, 이미지 및 테이블 형식의 데이터 분류 문제 유형에 사용할 수 있습니다.

회귀 또는 분류와 같은 표 형식의 데이터 사용 사례의 경우 Autopilot은 데이터를 탐색하고 가장 성능이 좋은 모델을 찾는 데 사용되는 코드가 포함된 노트북을 생성하여 데이터가 어떻게 랭글링되고 모델 후보가 어떻게 선택, 훈련 및 조정되었는지에 대한 추가 가시성을 제공합니다. 이 노트북들은 다양한 입력의 영향이나 여러 실험에서 이루어진 균형을 파악하는 데 도움이 될 대화형 탐색 환경을 제공합니다. Autopilot에서 제공하는 데이터 탐색 노트북 및 후보 정의 노트북을 직접 수정하여 더 우수한 성능의 모델 후보를 계속 실험해 볼 수 있습니다.

Amazon 에서는 사용한 금액만 SageMaker지불합니다. 사용량에 따라 SageMaker 또는 기타 AWS 서비스 내의 기본 컴퓨팅 및 스토리지 리소스에 대한 비용을 지불합니다. 사용 비용에 대한 자세한 내용은 Amazon SageMaker 요금 섹션을 SageMaker참조하세요.