Amazon SageMaker AI에서 모델을 배포하고 추론을 가져오는 옵션 이해

SageMaker AI 추론을 시작하는 데 도움이 되도록 SageMaker AI에 모델을 배포하고 추론을 가져오는 옵션을 설명하는 다음 섹션을 참조하세요. 이 Amazon SageMaker AI의 추론 옵션 섹션에서는 추론 사용 사례에 가장 적합한 기능을 결정하는 데 도움이 될 수 있습니다.

자세한 문제 해결 및 참조 정보, 시작하는 데 도움이 되는 블로그 및 예제, 일반적인 FAQ는 리소스 섹션을 참조하세요.

주제

시작하기 전 준비 사항

이들 항목에서는 하나 이상의 기계 학습 모델을 빌드 및 훈련하여 배포할 준비를 마쳤다고 가정합니다. SageMaker AI에서 모델을 배포하고 추론을 얻기 위해 SageMaker AI에서 모델을 훈련할 필요가 없습니다. 자체 모델이 없는 경우 SageMaker AI의 내장 알고리즘 또는 사전 훈련된 모델을 사용할 수도 있습니다.

SageMaker AI를 처음 사용하고 배포할 모델을 선택하지 않은 경우 Amazon SageMaker AI 시작하기 자습서의 단계를 수행합니다. 자습서를 사용하여 SageMaker AI가 데이터 과학 프로세스를 관리하는 방법과 모델 배포를 처리하는 방법을 숙지하세요. 모델 훈련에 대한 자세한 정보는 모델 훈련에서 확인하세요.

추가 정보, 참조, 예제는 리소스에서 확인하세요.

모델 배포 단계

추론 엔드포인트의 일반 워크플로는 다음과 같은 요소로 구성됩니다.

Amazon S3에 저장된 모델 아티팩트와 컨테이너 이미지를 가리키면서 SageMaker AI 추론에서 모델을 생성합니다.
추론 옵션을 선택합니다. 자세한 내용은 Amazon SageMaker AI의 추론 옵션 단원을 참조하십시오.
엔드포인트 뒤에 필요한 인스턴스 유형과 수를 선택하여 SageMaker AI 추론 엔드포인트 구성을 생성합니다. Amazon SageMaker Inference Recommender로 인스턴스 유형 권장 사항 가져오기가 가능합니다. 서버리스 추론의 경우 모델 크기에 따라 필요한 메모리 구성만 제공하면 됩니다.
SageMaker AI 추론 엔드포인트를 생성합니다.
엔드포인트를 호출하여 추론을 응답으로 수신합니다.

다음 다이어그램에서 이전 워크플로를 볼 수 있습니다.

SageMaker AI에서 추론을 가져오는 방법을 보여주는 이전 단락에 설명된 워크플로입니다.

AWS 콘솔, AWS SDKs, SageMaker Python SDK AWS CloudFormation 또는를 사용하여 이러한 작업을 수행할 수 있습니다 AWS CLI.

일괄 변환을 적용한 일괄 추론의 경우, 모델 아티팩트와 입력 데이터를 가리키고 일괄 추론 작업을 생성합니다. SageMaker AI는 추론용 엔드포인트를 호스팅하는 대신 선택한 Amazon S3 위치에 추론을 출력합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

모델 배포

추론 옵션