As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
É recomendável implantar seu modelo em um endpoint de inferência de SageMaker IA em tempo real e enviar solicitações para o endpoint. Examine manualmente as solicitações e respostas para garantir que ambas estejam em conformidade com os requisitos das seções Solicitações de endpoint para dados de séries temporais e Resposta do endpoint para dados de séries temporais. Se o seu contêiner de modelo oferecer compatibilidade com solicitações em lote, você poderá começar com uma única solicitação de registro e, em seguida, tentar dois ou mais registros.
Os comandos a seguir demonstram como solicitar uma resposta usando a AWS CLI. O AWS CLI vem pré-instalado nas instâncias Studio e SageMaker Notebook. Para instalar o AWS CLI, siga o guia de instalação
aws sagemaker-runtime invoke-endpoint \
--endpoint-name $ENDPOINT_NAME \
--content-type $CONTENT_TYPE \
--accept $ACCEPT_TYPE \
--body $REQUEST_DATA \
$CLI_BINARY_FORMAT \
/dev/stderr 1>/dev/null
Os parâmetros são definidos da seguinte forma:
$ENDPOINT NAME: o nome do endpoint.
$CONTENT_TYPE: o tipo MIME da solicitação (entrada do contêiner do modelo).
$ACCEPT_TYPE: o tipo MIME da resposta (saída do contêiner do modelo).
$REQUEST_DATA: a string de carga útil solicitada.
$CLI_BINARY_FORMAT: o formato do parâmetro da interface de linha de comandos (CLI). Para AWS CLI v1, esse parâmetro deve permanecer em branco. Para v2, esse parâmetro deve ser definido como
--cli-binary-format raw-in-base64-out
.
nota
AWS CLI A v2 passa parâmetros binários como strings codificadas em base64 por padrão. Os exemplos de solicitação e resposta a seguir de e para o endpoint usam AWS CLI v1.
No exemplo de código a seguir, a solicitação consiste de um único registro.
aws sagemaker-runtime invoke-endpoint \
--endpoint-name test-endpoint-json \
--content-type application/json \
--accept application/json \
--body '{"target": [1, 2, 3, 4, 5],
"start": "2024-01-01 01:00:00"}' \
/dev/stderr 1>/dev/null
O trecho a seguir mostra a saída correspondente da resposta.
{'predictions': {'mean': [1, 2, 3, 4, 5]}