Restauration automatique des nœuds - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Restauration automatique des nœuds

Lors de la création ou de la mise à jour du cluster, les utilisateurs administrateurs du cluster peuvent sélectionner l'option de restauration du nœud Automatic (instance) entre (recommandé) et None au niveau du cluster. S'il est défini surAutomatic, SageMaker HyperPod redémarre ou remplace automatiquement les nœuds défectueux.

Important

Nous vous recommandons de définir Automatic cette option.

La restauration automatique des nœuds s'exécute lorsque des problèmes sont détectés par un agent de surveillance de l'état, des bilans de santé de base et des bilans de santé approfondis. S'il est défini surNone, l'agent de surveillance de l'état étiquettera les instances lorsqu'un défaut est détecté, mais il ne lancera aucune action de réparation ou de restauration automatique sur les nœuds concernés. Cette option n'est pas recommandée.