기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
직접 호출을 통해 다중 컨테이너 엔드포인트를 호출하세요.
SageMaker AI 멀티컨테이너 엔드포인트를 사용하면 고객이 여러 컨테이너를 배포하여 SageMaker AI 엔드포인트에 다양한 모델을 배포할 수 있습니다. 단일 엔드포인트에서 최대 15개의 서로 다른 추론 컨테이너를 호스팅할 수 있습니다. 직접 호출을 사용하면 다중 컨테이너 엔드포인트에서 호스팅되는 특정 추론 컨테이너에 요청을 보낼 수 있습니다.
직접 호출로 다중 컨테이너 엔드포인트를 호출하려면 다른 엔드포인트를 호출하는 것처럼 invoke_endpointTargetContainerHostname
파라미터를 사용하여 호출할 컨테이너를 지정합니다.
다음 예제는 다중 컨테이너 엔드포인트의 secondContainer
를 직접 호출하여 예측을 가져옵니다.
import boto3 runtime_sm_client = boto3.Session().client('sagemaker-runtime') response = runtime_sm_client.invoke_endpoint( EndpointName ='my-endpoint', ContentType = 'text/csv', TargetContainerHostname='secondContainer', Body = body)
다중 컨테이너 엔드포인트에 대한 직접 호출 요청이 각각 있는 경우 TargetContainerHostname
가 있는 컨테이너만 호출 요청을 처리합니다. 다음 중 하나를 수행하면 확인 오류가 발생합니다.
-
엔드포인트에 존재하지 않는
TargetContainerHostname
를 지정하세요 -
직접 호출하도록 구성된 엔드포인트에 대한 요청에는
TargetContainerHostname
값을 지정하지 마세요. -
직접 호출이 구성되지 않은 엔드포인트에 대한 요청에는
TargetContainerHostname
값을 지정하세요