Integração com Amazon CloudWatch Logs - AWS ParallelCluster

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Integração com Amazon CloudWatch Logs

A partir da AWS ParallelCluster versão 2.6.0, os registros comuns são armazenados em CloudWatch Registros por padrão. Para obter mais informações sobre CloudWatch registros, consulte o Guia do usuário do Amazon CloudWatch Logs. Para configurar a integração do CloudWatch Logs, consulte a [cw_log]seção e a cw_log_settings configuração.

Um grupo de logs é criado para cada cluster com um nome /aws/parallelcluster/cluster-name (por exemplo, /aws/parallelcluster/testCluster). Cada log (ou conjunto de logs, se o caminho contiver um *) em cada nó possui um fluxo de logs denominado {hostname}.{instance_id}.{logIdentifier}. (Por exemplo, ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher). Os dados de log são enviados CloudWatch pelo CloudWatch agente, que é executado como root em todas as instâncias do cluster.

A partir da AWS ParallelCluster versão 2.10.0, um CloudWatch painel da Amazon é criado quando o cluster é criado. Esse painel facilita a revisão dos registros armazenados em CloudWatch Registros. Para obter mais informações, consulte CloudWatch Painel da Amazon.

Essa lista contém o logIdentifier e caminho para os fluxos de log disponíveis para plataformas, agendadores e nós.

Fluxos de log disponíveis para plataformas, programadores e nós
Plataformas Programadores Nodes Fluxos de log

amazon

centos

ubuntu

awsbatch

slurm

HeadNode

dcv-authenticator: /var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

dcv-agent: /var/log/dcv/agent.*.log

dcv-xsession: /var/log/dcv/dcv-xsession.*.log

dcv-server: /var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

Xdcv: /var/log/dcv/Xdcv.*.log

cfn-init: /var/log/cfn-init.log

chef-client: /var/log/chef-client.log

amazon

centos

ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

cloud-init: /var/log/cloud-init.log

supervisord: /var/log/supervisord.log

amazon

centos

ubuntu

slurm

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

computemgtd: /var/log/parallelcluster/computemgtd

slurmd: /var/log/slurmd.log

amazon

centos

ubuntu

slurm

HeadNode

clustermgtd: /var/log/parallelcluster/clustermgtd

slurm_resume: /var/log/parallelcluster/slurm_resume.log

slurm_suspend: /var/log/parallelcluster/slurm_suspend.log

slurmctld: /var/log/slurmctld.log

amazon

centos

awsbatch

slurm

ComputeFleet

HeadNode

system-messages: /var/log/messages

ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

syslog: /var/log/syslog

Os trabalhos em clusters que usam AWS Batch armazenam a saída de trabalhos que atingiram um FAILED estado RUNNINGSUCCEEDED, ou em CloudWatch Logs. O grupo de logs é /aws/batch/job, e o formato do nome do fluxo de logs é jobDefinitionName/default/ecs_task_id. Por padrão, esses logs são configurados para nunca expirar, mas você pode modificar o período de retenção. Para obter mais informações, consulte Alterar a retenção de dados de log em CloudWatch Logs no Guia do usuário do Amazon CloudWatch Logs.

nota

chef-client,cloud-init-output,clustermgtd,, computemgtdslurm_resume, e slurm_suspend foram adicionados na AWS ParallelCluster versão 2.9.0. Para a AWS ParallelCluster versão 2.6.0, /var/log/cfn-init-cmd.log (cfn-init-cmd) e /var/log/cfn-wire.log (cfn-wire) também foram armazenados em CloudWatch Logs.