Atualizar ou excluir endpoints que usam escalonamento automático - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Atualizar ou excluir endpoints que usam escalonamento automático

Atualize os endpoints que usam o escalonamento automático

Quando você atualiza um endpoint, o Application Auto Scaling verifica se algum dos modelos desse endpoint é alvo do escalonamento automático. Se a atualização alterar o tipo de instância de qualquer modelo que seja alvo de escalonamento automático, a atualização falhará.

No AWS Management Console, você vê um aviso de que deve cancelar o registro do modelo do escalonamento automático antes de poder atualizá-lo. Se você estiver tentando atualizar o endpoint chamando o UpdateEndpointAPI, a chamada falhará. Antes de atualizar o endpoint, exclua todas as políticas de escalabilidade configuradas para ele e cancele o registro da variante como um destino escalável chamando a ação Application Auto DeregisterScalableTargetScaling. API Depois de atualizar o endpoint, você pode registrar a variante atualizada como um destino escalável e anexar uma política de escalabilidade.

Há uma exceção. Se você alterar o modelo de uma variante configurada para escalonamento automático, o Amazon SageMaker auto scaling permitirá a atualização. Isso ocorre porque a alteração do modelo normalmente não afeta o desempenho o suficiente para alterar o comportamento de escalabilidade. Se você atualizar um modelo para uma variante configurada para escalonamento automático, certifique-se de que a alteração no modelo não afete significativamente o desempenho e o comportamento de escalabilidade.

Ao atualizar SageMaker endpoints que têm o escalonamento automático aplicado, conclua as seguintes etapas:

Para atualizar um endpoint que tenha o escalonamento automático aplicado
  1. Cancele o registro do endpoint como um alvo escalável ligando para. DeregisterScalableTarget

  2. Como o escalonamento automático é bloqueado enquanto a operação de atualização está em andamento (ou se você desativou o escalonamento automático na etapa anterior), talvez você queira tomar a precaução adicional de aumentar o número de instâncias do seu endpoint durante a atualização. Para fazer isso, atualize as contagens de instâncias das variantes de produção hospedadas no endpoint por meio de chamadas UpdateEndpointWeightsAndCapacities.

  3. Ligue DescribeEndpointrepetidamente até que o valor do EndpointStatus campo da resposta sejaInService.

  4. Ligue DescribeEndpointConfigpara obter os valores da configuração atual do endpoint.

  5. Crie uma nova configuração de endpoint chamando. CreateEndpointConfig Para as variantes de produção nas quais você deseja manter a contagem ou o peso de instâncias existentes, use o mesmo nome de variante da resposta da chamada DescribeEndpointConfigna etapa anterior. Para todos os outros valores, use os valores que você obteve como resposta quando ligou DescribeEndpointConfigna etapa anterior.

  6. Atualize o endpoint chamando UpdateEndpoint. Especifique a configuração do endpoint criado na etapa anterior no campo EndpointConfig. Se você quiser reter as propriedades da variante, como contagem de instâncias ou peso, defina o valor do parâmetro RetainAllVariantProperties como True. Isso especifica que as variantes de produção com o mesmo nome serão atualizadas com a DesiredInstanceCount mais recente da resposta da chamada para DescribeEndpoint, independentemente dos valores do campo InitialInstanceCount no novo EndpointConfig.

  7. (Opcional) Reative o escalonamento automático ligando para e. RegisterScalableTargetPutScalingPolicy

nota

As etapas 1 e 7 são necessárias somente se você estiver atualizando um endpoint com as seguintes alterações:

  • Alteração do tipo de instância de uma variante de produção que tem o escalonamento automático configurado

  • Removendo uma variante de produção que tenha o escalonamento automático configurado.

Excluir endpoints configurados para escalonamento automático

Se você excluir um endpoint, o Application Auto Scaling verificará se algum dos modelos desse endpoint é alvo do escalonamento automático. Se algum for e você tiver permissão para cancelar o registro do modelo, o Application Auto Scaling fará o cancelamento e esses modelos deixarão de ser destinos escaláveis, sem que você seja notificado. Se você usa uma política de permissão personalizada que não fornece permissão para a DeregisterScalableTargetação, você deve solicitar acesso a essa ação antes de excluir o endpoint.

nota

Como IAM usuário, talvez você não tenha permissão suficiente para excluir um endpoint se outro usuário tiver configurado o escalonamento automático para uma variante desse endpoint.