기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker AI 멀티컨테이너 엔드포인트를 사용하면 고객이 여러 컨테이너를 배포하여 SageMaker AI 엔드포인트에 다양한 모델을 배포할 수 있습니다. 단일 엔드포인트에서 최대 15개의 서로 다른 추론 컨테이너를 호스팅할 수 있습니다. 직접 호출을 사용하면 다중 컨테이너 엔드포인트에서 호스팅되는 특정 추론 컨테이너에 요청을 보낼 수 있습니다.
직접 호출로 다중 컨테이너 엔드포인트를 호출하려면 다른 엔드포인트를 호출하는 것처럼 invoke_endpointTargetContainerHostname
파라미터를 사용하여 호출할 컨테이너를 지정합니다.
다음 예제는 다중 컨테이너 엔드포인트의 secondContainer
를 직접 호출하여 예측을 가져옵니다.
import boto3
runtime_sm_client = boto3.Session().client('sagemaker-runtime')
response = runtime_sm_client.invoke_endpoint(
EndpointName ='my-endpoint',
ContentType = 'text/csv',
TargetContainerHostname='secondContainer',
Body = body)
다중 컨테이너 엔드포인트에 대한 직접 호출 요청이 각각 있는 경우 TargetContainerHostname
가 있는 컨테이너만 호출 요청을 처리합니다. 다음 중 하나를 수행하면 확인 오류가 발생합니다.
-
엔드포인트에 존재하지 않는
TargetContainerHostname
를 지정하세요 -
직접 호출하도록 구성된 엔드포인트에 대한 요청에는
TargetContainerHostname
값을 지정하지 마세요. -
직접 호출이 구성되지 않은 엔드포인트에 대한 요청에는
TargetContainerHostname
값을 지정하세요