Invoque um endpoint de vários contêineres com invocação direta
Os endpoints de vários contêineres do SageMaker permitem que os clientes implantem vários contêineres para modelos diferentes, em um único endpoint do SageMaker. Você pode hospedar até 15 contêineres de inferência diferentes em um único endpoint. Quando usar a invocação direta, você pode enviar uma solicitação para um contêiner de inferência específico hospedado em um endpoint de vários contêineres.
Para invocar um endpoint de vários contêineres com invocação direta, chame invoke_endpointTargetContainerHostname
.
O exemplo a seguir invoca diretamente o secondContainer
de um endpoint de vários contêineres para obter uma predição.
import boto3 runtime_sm_client = boto3.Session().client('sagemaker-runtime') response = runtime_sm_client.invoke_endpoint( EndpointName ='my-endpoint', ContentType = 'text/csv', TargetContainerHostname='secondContainer', Body = body)
Para cada solicitação de invocação direta para um endpoint de vários contêineres, somente o contêiner com o TargetContainerHostname
processa a solicitação de invocação. Você receberá erros de validação se fizer o seguinte:
-
Especifique um
TargetContainerHostname
que não exista no endpoint -
Não especifique um valor para
TargetContainerHostname
em uma solicitação para um endpoint configurado para invocação direta -
Especifique um valor para
TargetContainerHostname
em uma solicitação para um endpoint que não esteja configurado para invocação direta.