As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Atualize endpoints que usam escalonamento automático
Quando você atualiza um endpoint, o Application Auto Scaling verifica se algum dos modelos desse endpoint é alvo do escalonamento automático. Se a atualização alterar o tipo de instância de qualquer modelo que seja alvo de escalonamento automático, a atualização falhará.
No AWS Management Console, você vê um aviso de que deve cancelar o registro do modelo do escalonamento automático antes de poder atualizá-lo. Se você estiver tentando atualizar o endpoint chamando o UpdateEndpointAPI, a chamada falhará. Antes de atualizar o endpoint, exclua todas as políticas de escalabilidade configuradas para ele e cancele o registro da variante como um destino escalável chamando a ação Application Auto DeregisterScalableTargetScaling. API Depois de atualizar o endpoint, você pode registrar a variante atualizada como um destino escalável e anexar uma política de escalabilidade.
Há uma exceção. Se você alterar o modelo de uma variante configurada para escalonamento automático, o Amazon SageMaker auto scaling permitirá a atualização. Isso ocorre porque a alteração do modelo normalmente não afeta o desempenho o suficiente para alterar o comportamento de escalabilidade. Se você atualizar um modelo para uma variante configurada para escalonamento automático, certifique-se de que a alteração no modelo não afete significativamente o desempenho e o comportamento de escalabilidade.
Ao atualizar SageMaker endpoints que têm o escalonamento automático aplicado, conclua as seguintes etapas:
Para atualizar um endpoint que tenha o escalonamento automático aplicado
-
Cancele o registro do endpoint como um alvo escalável ligando para. DeregisterScalableTarget
-
Como o escalonamento automático é bloqueado enquanto a operação de atualização está em andamento (ou se você desativou o escalonamento automático na etapa anterior), talvez você queira tomar a precaução adicional de aumentar o número de instâncias do seu endpoint durante a atualização. Para fazer isso, atualize as contagens de instâncias das variantes de produção hospedadas no endpoint por meio de chamadas UpdateEndpointWeightsAndCapacities.
-
Ligue DescribeEndpointrepetidamente até que o valor do
EndpointStatus
campo da resposta sejaInService
. -
Ligue DescribeEndpointConfigpara obter os valores da configuração atual do endpoint.
-
Crie uma nova configuração de endpoint chamando. CreateEndpointConfig Para as variantes de produção nas quais você deseja manter a contagem ou o peso de instâncias existentes, use o mesmo nome de variante da resposta da chamada DescribeEndpointConfigna etapa anterior. Para todos os outros valores, use os valores que você obteve como resposta ao chamar DescribeEndpointConfigna etapa anterior.
-
Atualize o endpoint chamando UpdateEndpoint. Especifique a configuração do endpoint criado na etapa anterior no campo
EndpointConfig
. Se você quiser reter as propriedades da variante, como contagem de instâncias ou peso, defina o valor do parâmetroRetainAllVariantProperties
comoTrue
. Isso especifica que as variantes de produção com o mesmo nome serão atualizadas com aDesiredInstanceCount
mais recente da resposta da chamada paraDescribeEndpoint
, independentemente dos valores do campoInitialInstanceCount
no novoEndpointConfig
. -
(Opcional) Reative o escalonamento automático ligando para e. RegisterScalableTargetPutScalingPolicy
nota
As etapas 1 e 7 são necessárias somente se você estiver atualizando um endpoint com as seguintes alterações:
-
Alteração do tipo de instância de uma variante de produção com escalonamento automático configurado
-
Removendo uma variante de produção com escalonamento automático configurado.