Implantação e predição de modelos do Autopilot
Este guia do Amazon SageMaker Autopilot inclui as etapas para a implantação do modelo, configuração da inferência em tempo real e execução com trabalhos em lote.
Depois de criar e treinar seus modelos, você poderá implantá-los para obter predições de duas maneiras:
-
Use Implantar modelos para inferência em tempo real para configurar um endpoint e obter predições de forma interativa. A inferência em tempo real é ideal para workloads de inferência em que você tem requisitos em tempo real, interativos e de baixa latência.
-
Use Execução de trabalhos de inferência em lote para fazer predições paralelas em lotes de observações em um conjunto de dados inteiro. A inferência em lote é uma boa opção para grandes conjuntos de dados ou se você não precisar de uma resposta imediata a uma solicitação de predição de modelo.
nota
Para evitar cobranças desnecessárias: depois que os endpoints e os recursos criados a partir da implantação do modelo não forem mais necessários, você poderá excluí-los. Para obter informações sobre a definição de preço de instâncias por região, consulte Preço do Amazon SageMaker