Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Alarmes do cluster - AWS ParallelCluster

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Alarmes do cluster

O monitoramento da integridade do cluster é essencial para garantir o desempenho ideal. AWS ParallelCluster permite monitorar vários alarmes CloudWatch baseados no nó principal do cluster.

Esta seção fornece detalhes para cada tipo de alarme de cluster do nó principal, incluindo suas convenções de nomenclatura, condições específicas que acionam os alarmes e etapas sugeridas para solução de problemas.

A convenção de nomenclatura para alarmes de cluster é CLUSTER_NAME-COMPONENT-METRIC, por exemplo, mycluster-HeadNode-Cpu.

  • CLUSTER_NAME-HeadNode: sinaliza o status geral do nó principal. Fica vermelho se pelo menos um dos alarmes abaixo estiver ativo.

  • CLUSTER_NAME-HeadNode-Health: vermelho se houver pelo menos uma falha no Amazon EC2 Health Check. Em caso de alarme, sugerimos verificar Solucionar problemas de instâncias com verificações de status com falha.

  • CLUSTER_NAME-HeadNode-Cpu: vermelho se a utilização da CPU for maior que 90%. Em caso de alarme, verifique os processos que mais estão consumindo a CPU com ps -aux --sort=-%cpu | head -n 10.

  • CLUSTER_NAME-HeadNode-Mem: vermelho se a utilização da memória for maior que 90%. Em caso de alarme, verifique os processos que mais estão consumindo memória com ps -aux --sort=-%mem | head -n 10.

  • CLUSTER_NAME-HeadNode-Disk: vermelho se o espaço em disco ocupado for maior que 90% no caminho /. Em caso de alarme, verifique as pastas que consomem a maior parte do espaço com du -h --max-depth=2 / 2> /dev/null | sort -hr.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.