Recuperação automática de nós - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Recuperação automática de nós

Durante a criação ou atualização do cluster, os usuários administradores do cluster podem selecionar a opção de recuperação do nó (instância) entre Automatic (Recomendado) e None no nível do cluster. Se definido comoAutomatic, SageMaker HyperPod reinicializa ou substitui automaticamente os nós defeituosos.

Importante

Recomendamos definir a Automatic opção.

A recuperação automática de nós é executada quando problemas são encontrados no agente de monitoramento de integridade, nas verificações básicas de saúde e nas verificações de integridade detalhadas. Se definido comoNone, o agente de monitoramento de integridade rotulará as instâncias quando uma falha for detectada, mas não iniciará automaticamente nenhuma ação de reparo ou recuperação nos nós afetados. Essa opção não é recomendada.