Alarmes de cluster - AWS ParallelCluster

Alarmes de cluster

La surveillance de l'état du cluster est essentielle pour garantir des performances optimales. AWS ParallelCluster vous permet de surveiller plusieurs alarmes CloudWatch basées sur le nœud principal du cluster.

Cette section fournit des détails sur chaque type d'alarmes du cluster de nœuds principaux, y compris ses conventions de dénomination, les conditions spécifiques qui déclenchent les alarmes et les étapes de dépannage suggérées.

La convention de dénomination pour les alarmes de cluster estCLUSTER_NAME-COMPONENT-METRIC, par exemple mycluster-HeadNode-Cpu

CLUSTER_NAME-HeadNode: indique l'état général du nœud principal. Il est rouge si au moins l'une des alarmes ci-dessous l'est.
CLUSTER_NAME-HeadNode-Health: rouge s'il y a au moins un échec d'Amazon EC2 Health Check. En cas d'alarme, nous vous suggérons de consulter la section Résoudre les problèmes des instances dont les vérifications d'état ont échoué.
CLUSTER_NAME-HeadNode-Cpu: rouge si l'utilisation du processeur est supérieure à 90 %. En cas d'alarme, vérifiez quels sont les processus qui consomment le plus le processeurps -aux --sort=-%cpu | head -n 10.
CLUSTER_NAME-HeadNode-Mem: rouge si l'utilisation de la mémoire est supérieure à 90 %. En cas d'alarme, vérifiez les processus qui consomment le plus de mémoireps -aux --sort=-%mem | head -n 10.
CLUSTER_NAME-HeadNode-Disk: rouge si l'espace disque occupé est supérieur à 90 % sur le chemin /. En cas d'alarme, vérifiez les dossiers qui occupent la plus grande partie de l'espacedu -h --max-depth=2 / 2> /dev/null | sort -hr.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Voir les erreurs liées à la personnalisation Slurm configuration

AWS ParallelCluster politique de support

Sélectionner vos préférences de cookies

Personnaliser les préférences de cookies

Essentiels

Performances

Fonctionnels

Publicitaires

Impossible d'enregistrer les préférences concernant les cookies

Alarmes de cluster

Cette page vous a-t-elle été utile ?

Rubrique suivante :

Rubrique précédente :

Avez-vous besoin d’aide ?