Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Observation des erreurs lors de l'initialisation des nœuds de calcul
Les sections suivantes fournissent des conseils de résolution des problèmes lorsque vous constatez des erreurs lors de l'initialisation des nœuds de calcul. Cela inclut les erreurs d'amorçage, l'affichage des erreurs dans les journaux et la marche à suivre si aucun des scénarios ne s'applique à votre situation spécifique.
Rubriques
- Voir Node bootstrap error dans clustermgtd.log
- J'ai configuré des réservations de capacité à la demande (ODCRs) ou des instances réservées zonales
- Voir An error occurred (VcpuLimitExceeded)slurm_resume.log quand je ne parviens pas à exécuter une tâche, ou quand je ne parviens pas à créer un cluster clustermgtd.log
- Voir An error occurred (InsufficientInstanceCapacity)slurm_resume.log quand je ne parviens pas à exécuter une tâche, ou quand je ne parviens pas à créer un cluster clustermgtd.log
- Voir que les nœuds sont en DOWN état avec Reason (Code:InsufficientInstanceCapacity)...
- Voir cannot change locale (en_US.utf-8) because it has an invalid name dans slurm_resume.log
- Aucun des scénarios précédents ne s'applique à ma situation