Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Recuperación automática de nodos
Durante la creación o actualización del clúster, los usuarios administradores del clúster pueden seleccionar la opción de recuperación de nodos (instancia) entre Automatic
(recomendada) y None
a nivel de clúster. Si se establece enAutomatic
, SageMaker HyperPod reinicia o reemplaza automáticamente los nodos defectuosos.
importante
Se recomienda configurar la Automatic
opción.
La recuperación automática de los nodos se ejecuta cuando se detectan problemas debido a un agente de supervisión del estado, a las comprobaciones de estado básicas y a las comprobaciones de estado exhaustivas. Si se establece en esta opciónNone
, el agente de supervisión del estado etiquetará las instancias cuando se detecte un fallo, pero no iniciará automáticamente ninguna acción de reparación o recuperación en los nodos afectados. No se recomienda usar esta opción.