

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# SageMaker AI에서의 모델 배포
<a name="model-deploy-mlops"></a>

프로덕션용 모델을 훈련하고 승인한 후에는 SageMaker AI를 사용하여 실시간 추론을 위해 엔드포인트에 모델을 배포할 수 있습니다. SageMaker AI는 워크로드에 가장 적합한 옵션을 선택할 수 있도록 여러 추론 옵션을 제공합니다. 또한 최적의 성능을 위해 필요한 인스턴스 유형과 인스턴스 수를 선택하여 엔드포인트를 구성할 수 있습니다. 모델 배포에 대한 자세한 내용은 [추론 모델 배포](deploy-model.md)섹션을 참조하세요.



모델을 프로덕션에 배포한 후에는 현재 모델의 가용성을 유지하면서 모델 성능을 더욱 최적화하는 방법을 모색하고자 할 수 있습니다. 예를 들어, 변경 사항을 적용하기 전에 섀도우 테스트를 설정하여 인프라를 제공하는 다른 모델이나 모델을 시험해 볼 수 있습니다. SageMaker AI는 새 모델, 컨테이너 또는 인스턴스를 섀도우 모드로 배포하고 동일한 엔드포인트 내에서 실시간으로 추론 요청의 사본을 해당 모델에 라우팅합니다. 섀도우 변형의 응답을 기록하여 비교할 수 있습니다. 섀도우 테스트에 대한 자세한 내용은 [섀도우 테스트](shadow-tests.md)섹션을 참조하세요. 계속해서 모델을 변경하기로 결정한 경우 배포 가드레일을 사용하여 현재 모델에서 새 모델로의 전환을 제어할 수 있습니다. 트래픽 이동 프로세스에 대한 블루/그린 또는 Canary 테스트와 같은 방법을 선택하여 업데이트 중에 세밀한 제어를 유지할 수 있습니다. 배포 가드레일에 대한 자세한 내용은 [프로덕션에서 모델을 업데이트하기 위한 배포 가드레일](deployment-guardrails.md)섹션을 참조하세요.