As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Recuperação automática de nós
Durante a criação ou atualização do cluster, os usuários administradores do cluster podem selecionar a opção de recuperação do nó (instância) entre Automatic
(Recomendado) e None
no nível do cluster. Se definido comoAutomatic
, SageMaker HyperPod reinicializa ou substitui automaticamente os nós defeituosos.
Importante
Recomendamos definir a Automatic
opção.
A recuperação automática de nós é executada quando problemas são encontrados no agente de monitoramento de integridade, nas verificações básicas de saúde e nas verificações de integridade detalhadas. Se definido comoNone
, o agente de monitoramento de integridade rotulará as instâncias quando uma falha for detectada, mas não iniciará automaticamente nenhuma ação de reparo ou recuperação nos nós afetados. Essa opção não é recomendada.