Recuperación automática de nodos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Recuperación automática de nodos

Durante la creación o actualización del clúster, los usuarios administradores del clúster pueden seleccionar la opción de recuperación de nodos (instancia) entre Automatic (recomendada) y None a nivel de clúster. Si se establece enAutomatic, SageMaker HyperPod reinicia o reemplaza automáticamente los nodos defectuosos.

importante

Se recomienda configurar la Automatic opción.

La recuperación automática de los nodos se ejecuta cuando se detectan problemas debido a un agente de supervisión del estado, a las comprobaciones de estado básicas y a las comprobaciones de estado exhaustivas. Si se establece en esta opciónNone, el agente de supervisión del estado etiquetará las instancias cuando se detecte un fallo, pero no iniciará automáticamente ninguna acción de reparación o recuperación en los nodos afectados. No se recomienda usar esta opción.