As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Obter instâncias prospectivas instantâneas
O Inference Recommender também pode fornecer uma lista de instâncias em potencial, ou tipos de instância que podem ser adequados para seu modelo, na página de detalhes do SageMaker modelo. O recomendador de inferência executa automaticamente a análise comparativa em relação ao seu modelo para que você forneça as instâncias potenciais. Como essas são recomendações preliminares, recomendamos que você execute outros trabalhos de recomendação de instâncias para obter resultados mais precisos.
Você pode ver uma lista de instâncias potenciais para seu modelo de forma programática usando o, DescribeModelAPIo SageMaker Python SDK ou o console. SageMaker
nota
Você não obterá instâncias potenciais para modelos que você criou SageMaker antes da disponibilização desse recurso.
Para visualizar instâncias em potencial para seu modelo por meio do console, faça o seguinte:
-
Acesse o SageMaker console em https://console.aws.amazon.com/sagemaker/
. -
No painel de navegação, escolha Inferência e, em seguida, escolha Modelos.
-
Na lista de modelos, escolha seu modelo.
Na página de detalhes do seu modelo, acesse a seção Instâncias potenciais para implantar o modelo. A captura de tela a seguir mostra essa seção.
Nesta seção, você pode ver as instâncias em potencial que são otimizadas em termos de custo, taxa de transferência e latência para a implantação do modelo, junto com informações adicionais para cada tipo de instância, como tamanho, GPU contagem de memória CPU e custo por hora.
Se você decidir comparar um exemplo de carga e executar um trabalho completo de recomendação de inferência para seu modelo, poderá iniciar um trabalho de recomendação de inferência padrão nesta página. Para iniciar um trabalho padrão por meio do console, faça o seguinte:
-
Na página de detalhes do modelo, na seção Instâncias potenciais para implantar o modelo, escolha Executar o trabalho de recomendador de inferência.
-
Na caixa de diálogo que aparece, para o bucket do S3 para análise comparativa da carga útil, insira o local do Amazon S3 onde você armazenou um exemplo de carga para seu modelo.
-
Em Tipo de conteúdo de carga útil, insira os MIME tipos para seus dados de carga útil.
-
(Opcional) Na seção Compilação de modelo usando SageMaker Neo, para a configuração de entrada de dados, insira uma forma de dados no formato de dicionário.
-
Escolha Run job (Executar trabalho).
O Inference Recommender inicia o trabalho e você pode ver o trabalho e seus resultados na página da lista de recomendações de inferência no console. SageMaker
Se você quiser executar um trabalho avançado e realizar testes de carga personalizados ou se quiser definir configurações e parâmetros adicionais para seu trabalho, consulte Executar um teste de carga personalizado.