Implantação e predição de modelos do Autopilot

Este guia do Amazon SageMaker Autopilot inclui as etapas para a implantação do modelo, configuração da inferência em tempo real e execução com trabalhos em lote.

Depois de criar e treinar seus modelos, você poderá implantá-los para obter predições de duas maneiras:

Use Implantar modelos para inferência em tempo real para configurar um endpoint e obter predições de forma interativa. A inferência em tempo real é ideal para workloads de inferência em que você tem requisitos em tempo real, interativos e de baixa latência.
Use Execução de trabalhos de inferência em lote para fazer predições paralelas em lotes de observações em um conjunto de dados inteiro. A inferência em lote é uma boa opção para grandes conjuntos de dados ou se você não precisar de uma resposta imediata a uma solicitação de predição de modelo.

nota

Para evitar cobranças desnecessárias: depois que os endpoints e os recursos criados a partir da implantação do modelo não forem mais necessários, você poderá excluí-los. Para obter informações sobre a definição de preço de instâncias por região, consulte Preço do Amazon SageMaker.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Métricas e validação

Implantar modelos para inferência em tempo real