As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Implantar seus modelos em um endpoint
No Amazon SageMaker Canvas, você pode implantar seus modelos em um endpoint para fazer previsões. SageMaker A IA fornece a infraestrutura de ML para você hospedar seu modelo em um endpoint com as instâncias de computação que você escolher. Em seguida, você pode invocar o endpoint (enviar uma solicitação de predição) e obter uma predição em tempo real do seu modelo. Com essa funcionalidade, você pode usar seu modelo na produção para responder às solicitações de entrada e integrar seu modelo aos fluxos de trabalho e aplicações existentes.
Para começar, você deve ter uma versão do modelo pronta para implantação. Você pode implantar versões de modelos personalizados que você criou, modelos de SageMaker JumpStart fundação da Amazon e modelos de fundação ajustados. JumpStart Para obter mais informações sobre a criação de um modelo no Canvas, consulte Como os modelos personalizados funcionam. Para obter mais informações sobre modelos de JumpStart base no Canvas, consulteModelos básicos de IA generativa no Canvas SageMaker .
Revise a seção Gerenciamento de permissões a seguir e comece a criar novas implantações na seção Implantação de modelo.
Gerenciamento de permissões
Por padrão, você tem permissões para implantar modelos nos endpoints do SageMaker AI Hosting. SageMaker A IA concede essas permissões para todos os perfis de usuário do Canvas novos e existentes por meio da AmazonSageMakerCanvasFullAccesspolítica, que é anexada à função de execução AWS do IAM para o domínio de SageMaker IA que hospeda seu aplicativo Canvas.
Se o administrador do Canvas estiver configurando um novo domínio ou perfil de usuário, ao configurar o domínio e seguir as instruções de pré-requisito noPré-requisitos para configurar o Amazon Canvas SageMaker , o SageMaker AI ativa as permissões de implantação do modelo por meio da opção Habilitar implantação direta de modelos do Canvas, que é ativada por padrão.
O administrador do Canvas também pode gerenciar as permissões implantações de modelos no nível do perfil do usuário. Por exemplo, se o administrador não quiser conceder permissões de implantações de modelos a todos os perfis de usuário ao configurar um domínio, ele poderá conceder permissões a usuários específicos após criar o domínio.
O seguinte procedimento mostra como desativar permissões de implantações de modelos para um perfil de usuário específico:
-
Abra o console de SageMaker IA em https://console.aws.amazon.com/sagemaker/
. -
No painel de navegação à esquerda, escolha Configurações do administrador.
-
Em Configurações do administrador, escolha Domínios.
-
Na lista de Domínios, selecione o Domínio do perfil do usuário.
-
Na página Detalhes do Domínio, escolha a aba Perfis de usuário.
-
Escolha seu Perfil de usuário.
-
Na página do perfil do usuário, selecione a aba Configurações da aplicação.
-
Na seção Logs, selecione Editar.
-
Na seção de configuração do Operações, ative a opção Habilitar implantação direta de modelos do Canvas para habilitar as permissões de implantação.
-
Escolha Enviar para salvar as alterações nas configurações do seu Domínio.
O perfil do usuário não deve mais ter permissões para implantações de modelos.
Depois de conceder permissões ao domínio ou perfil do usuário, certifique-se de que o usuário saia da aplicação Canvas e faça login novamente para aplicar as alterações de permissão.
Implantar um modelo
Para começar a implantar seu modelo, você cria uma nova implantação no Canvas e especifica a versão do modelo que deseja implantar junto com a infraestrutura de ML, como o tipo e o número de instâncias de computação que você gostaria de usar para hospedar o modelo.
O Canvas sugere um tipo padrão e um número de instâncias com base no seu tipo de modelo, ou você pode aprender mais sobre os vários tipos de instância de SageMaker IA na página de preços do Amazon SageMaker AI
Ao implantar modelos JumpStart básicos, você também tem a opção de especificar a duração do tempo de implantação. Você pode implantar o modelo em um endpoint indefinidamente (o que significa que o endpoint está ativo até você excluir a implantação). Ou, se você precisar do endpoint apenas por um curto período de tempo e quiser reduzir custos, você pode implantar o modelo em um endpoint por um determinado período de tempo, após o qual a SageMaker IA desliga o endpoint para você.
nota
Se você implantar um modelo por um período de tempo especificado, permaneça conectado à aplicação Canvas durante o endpoint. Se você sair ou excluir a aplicação, o Canvas não poderá encerrar o endpoint no horário especificado.
Depois que seu modelo for implantado em um endpoint de inferência em tempo real do SageMaker AI Hosting, você pode começar a fazer previsões invocando o endpoint.
Há várias maneiras diferentes de implantar uma versão de modelo a partir da aplicação Canvas. É possível acessar a opção de implantação do modelo usando qualquer um dos seguintes métodos:
-
Na página Meus modelos da aplicação Canvas, você pode escolher o modelo que deseja implantar. Em seguida, na página Versões do modelo, você pode escolher o ícone Mais opções (
) ao lado da versão do modelo e selecionar Implantar.
-
Na página de detalhes de uma versão do modelo, na guia Analisar, você pode escolher a opção Implantar.
-
Na página de detalhes de uma versão do modelo, na guia Prever, você pode escolher o ícone Mais opções (
) na parte superior da página e selecionar Implantar.
-
Na página Operações da aplicação Canvas, escolha a guia Implantações e, em seguida, escolha Criar implantação.
-
Para modelos de JumpStart fundação e modelos de fundação ajustados, acesse a página de Ready-to-use modelos do aplicativo Canvas. Escolha Gerar, extrair e resumir conteúdo. Em seguida, encontre o modelo de JumpStart base ou o modelo de fundação ajustado que você deseja implantar. Escolha o modelo e, na página de bate-papo do modelo, escolha o botão Implantar.
Todos esses métodos abrem o painel lateral Implantar modelo, onde você especifica a configuração de implantação do seu modelo. Para implantar o modelo a partir desse painel, faça o seguinte:
-
(Opcional) Se você estiver criando uma implantação na página Operações, você terá a opção de Selecionar modelo e versão. Use os menus suspensos para selecionar o modelo e a versão do modelo que você deseja implantar.
-
Insira um nome no campo Nome da implantação.
-
(Somente para modelos de JumpStart base e modelos de base ajustados) Escolha um comprimento de implantação. Selecione Indefinido para deixar o endpoint ativo até que você o desligue, ou selecione Especificar comprimento e, em seguida, insira o período durante o qual você deseja que o endpoint permaneça ativo.
-
Em Tipo de instância, a SageMaker IA detecta um tipo e número de instância padrão adequados ao seu modelo. No entanto, você pode alterar o tipo de instância que gostaria de usar para hospedar seu modelo.
nota
Se você ficar sem a cota de instância para o tipo de instância escolhido em sua AWS conta, poderá solicitar um aumento de cota. Para obter mais informações sobre as cotas padrão e como solicitar um aumento, consulte os endpoints e cotas do Amazon SageMaker AI no guia de referência AWS geral.
-
Em Contagem de instâncias, você pode definir o número de instâncias ativas que são usadas para seu endpoint. SageMaker A IA detecta um número padrão adequado ao seu modelo, mas você pode alterar esse número.
-
Quando estiver pronto para implantação do seu modelo, selecione Implantar.
Seu modelo agora deve ser implantado em um endpoint.