As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Implantar seus modelos em um endpoint
No Amazon SageMaker Canvas, você pode implantar seus modelos em um endpoint para fazer previsões. SageMaker fornece a infraestrutura de ML para você hospedar seu modelo em um endpoint com as instâncias de computação que você escolher. Em seguida, você pode invocar o endpoint (enviar uma solicitação de previsão) e obter uma previsão em tempo real do seu modelo. Com essa funcionalidade, você pode usar seu modelo na produção para responder às solicitações de entrada e integrar seu modelo aos fluxos de trabalho e aplicações existentes.
Para começar, você deve ter um modelo que gostaria de implantar. Você pode implantar versões personalizadas de modelos que você criou, modelos de SageMaker JumpStart fundação da Amazon e modelos de fundação ajustados. JumpStart Para obter mais informações sobre a criação de um modelo no Canvas, consulte Como os modelos personalizados funcionam. Para obter mais informações sobre modelos de JumpStart base no Canvas, consulteModelos básicos de IA generativa no Canvas SageMaker .
Revise a seção Gerenciamento de permissões a seguir e comece a criar novas implantações na seção Implantação de modelo.
Gerenciamento de permissões
Por padrão, você tem permissões para implantar modelos nos endpoints do SageMaker Hosting. SageMaker concede essas permissões para todos os perfis de usuário do Canvas novos e existentes por meio da AmazonSageMakerCanvasFullAccesspolítica, que é anexada à função de AWS IAM execução do SageMaker domínio que hospeda seu aplicativo Canvas.
Se o administrador do Canvas estiver configurando um novo domínio ou perfil de usuário, ao configurar o domínio e seguir as instruções de pré-requisito noPré-requisitos para configurar o Amazon Canvas SageMaker , SageMaker ativa as permissões de implantação do modelo por meio da opção Habilitar implantação direta de modelos do Canvas, que é ativada por padrão.
O administrador do Canvas também pode gerenciar as permissões implantações de modelos no nível do perfil do usuário. Por exemplo, se o administrador não quiser conceder permissões de implantação do modelo a todos os perfis de usuário ao configurar um domínio, ele poderá conceder permissões a usuários específicos após criar o domínio.
O procedimento a seguir mostra como modificar as permissões de implantação do modelo para um perfil de usuário específico:
-
Abra o SageMaker console em https://console.aws.amazon.com/sagemaker/
. -
No painel de navegação à esquerda, escolha Configurações do administrador.
-
Em Configurações do administrador, escolha Domínios.
-
Na lista de domínios, selecione o domínio do perfil do usuário.
-
Na página Detalhes do domínio, selecione a guia Perfis de usuário.
-
Escolha seu perfil de usuário.
-
Na página do perfil do usuário, selecione a guia Configurações do aplicativo.
-
Na seção Tela, escolha Editar.
-
Na seção de configuração do ML Ops, ative a opção Habilitar implantação direta de modelos do Canvas para ativar as permissões de implantação.
-
Escolha Enviar para salvar as alterações nas configurações do seu domínio.
O perfil do usuário agora deve ter permissões de implantação do modelo.
Depois de conceder permissões ao domínio ou perfil do usuário, certifique-se de que o usuário saia do aplicativo Canvas e faça login novamente para aplicar as alterações de permissão.
Implantar um modelo
Para começar a implantar seu modelo, você cria uma nova implantação no Canvas e especifica a versão do modelo que deseja implantar junto com a infraestrutura de ML, como o tipo e o número de instâncias de computação que você gostaria de usar para hospedar o modelo.
O Canvas sugere um tipo padrão e um número de instâncias com base no seu tipo de modelo, ou você pode aprender mais sobre os vários tipos de SageMaker instância na página de SageMaker preços da Amazon
Ao implantar modelos JumpStart básicos, você também tem a opção de especificar a duração do tempo de implantação. Você pode implantar o modelo em um endpoint indefinidamente (o que significa que o endpoint está ativo até você excluir a implantação). Ou, se você precisar do endpoint apenas por um curto período de tempo e quiser reduzir custos, você pode implantar o modelo em um endpoint por um determinado período de tempo e, em seguida, SageMaker desligar o endpoint para você.
nota
Se você implantar um modelo por um período de tempo especificado, permaneça conectado ao aplicativo Canvas durante o endpoint. Se você sair ou excluir o aplicativo, o Canvas não poderá desligar o endpoint no horário especificado.
Depois que seu modelo for implantado em um endpoint de inferência em tempo real do SageMaker Hosting, você pode começar a fazer previsões invocando o endpoint.
Há várias maneiras diferentes de implantar um modelo a partir do aplicativo Canvas. É possível acessar a opção de implantação do modelo usando qualquer um dos seguintes métodos:
-
Na página Meus modelos do aplicativo Canvas, escolha o modelo que você deseja implantar. Em seguida, na página Versões do modelo, escolha o ícone Mais opções ( ) ao lado da versão do modelo e selecione Implantar.
-
Na página de detalhes de uma versão do modelo, na guia Analisar, escolha a opção Implantar.
-
Na página de detalhes de uma versão do modelo, na guia Prever, escolha o ícone Mais opções ( ) na parte superior da página e selecione Implantar.
-
Na página ML Ops do aplicativo Canvas, escolha a guia Implantações e, em seguida, escolha Criar implantação.
-
Para modelos de JumpStart fundação e modelos de fundação ajustados, acesse a página de Ready-to-use modelos do aplicativo Canvas. Escolha Gerar, extrair e resumir conteúdo. Em seguida, encontre o modelo de JumpStart base ou o modelo de fundação ajustado que você deseja implantar. Escolha o modelo e, na página de bate-papo do modelo, escolha o botão Implantar.
Todos esses métodos abrem o painel lateral Implantar modelo, onde você especifica a configuração de implantação do seu modelo. Para implantar o modelo a partir desse painel, faça o seguinte:
-
(Opcional) Se você estiver criando uma implantação na página ML Ops, você terá a opção de selecionar modelo e versão. Use os menus suspensos para selecionar o modelo e a versão do modelo que você deseja implantar.
-
Insira um nome no campo Nome da implantação.
-
(Somente para modelos de JumpStart base e modelos de base ajustados) Escolha um comprimento de implantação. Selecione Indefinido para deixar o endpoint ativo até que você o desligue, ou selecione Especificar duração e, em seguida, insira o período durante o qual você deseja que o endpoint permaneça ativo.
-
Em Tipo de instância, SageMaker detecta um tipo e número de instância padrão adequados ao seu modelo. No entanto, você pode alterar o tipo de instância que gostaria de usar para hospedar seu modelo.
nota
Se você ficar sem a cota de instância para o tipo de instância escolhido em sua AWS conta, poderá solicitar um aumento de cota. Para obter mais informações sobre as cotas padrão e como solicitar um aumento, consulte SageMaker endpoints e cotas da Amazon no guia de referência AWS geral.
-
Em Contagem de instâncias, você pode definir o número de instâncias ativas que são usadas para seu endpoint. SageMaker detecta um número padrão adequado ao seu modelo, mas você pode alterar esse número.
-
Quando estiver pronto para implantação do seu modelo, selecione Implantar.
Seu modelo agora deve ser implantado em um endpoint.