Integración con Amazon CloudWatch Logs - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Integración con Amazon CloudWatch Logs

A partir de AWS ParallelCluster la versión 2.6.0, los registros comunes se almacenan en CloudWatch Logs de forma predeterminada. Para obtener más información sobre CloudWatch los registros, consulte la Guía del usuario de Amazon CloudWatch Logs. Para configurar la integración de CloudWatch Logs, consulte la [cw_log]sección y la cw_log_settings configuración.

Se crea un grupo de registros para cada clúster con el nombre /aws/parallelcluster/cluster-name (por ejemplo, /aws/parallelcluster/testCluster). Cada registro (o conjunto de registros si la ruta contiene un *) de cada nodo tiene un flujo de registro denominado {hostname}.{instance_id}.{logIdentifier}. (Por ejemplo: ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher). El CloudWatch agente envía los datos CloudWatch de registro y se ejecuta como root en todas las instancias del clúster.

A partir de AWS ParallelCluster la versión 2.10.0, se crea un CloudWatch panel de Amazon al crear el clúster. Este panel facilita la revisión de los registros almacenados en CloudWatch Logs. Para obtener más información, consulte CloudWatch Panel de control de Amazon.

Esta lista contiene la ruta logIdentifier y la ruta de los flujos de registros disponibles para las plataformas, los programadores y los nodos.

Flujos de registro disponibles para plataformas, programadores y nodos
Plataformas Programadores Nodos Flujos de registro

amazon

centos

ubuntu

awsbatch

Slurm

HeadNode

dcv-authenticator: /var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

dcv-agent: /var/log/dcv/agent.*.log

dcv-xsession: /var/log/dcv/dcv-xsession.*.log

dcv-server: /var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

Xdcv: /var/log/dcv/Xdcv.*.log

cfn-init: /var/log/cfn-init.log

chef-client: /var/log/chef-client.log

amazon

centos

ubuntu

awsbatch

Slurm

ComputeFleet

HeadNode

cloud-init: /var/log/cloud-init.log

supervisord: /var/log/supervisord.log

amazon

centos

ubuntu

Slurm

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

computemgtd: /var/log/parallelcluster/computemgtd

slurmd: /var/log/slurmd.log

amazon

centos

ubuntu

Slurm

HeadNode

clustermgtd: /var/log/parallelcluster/clustermgtd

slurm_resume: /var/log/parallelcluster/slurm_resume.log

slurm_suspend: /var/log/parallelcluster/slurm_suspend.log

slurmctld: /var/log/slurmctld.log

amazon

centos

awsbatch

Slurm

ComputeFleet

HeadNode

system-messages: /var/log/messages

ubuntu

awsbatch

Slurm

ComputeFleet

HeadNode

syslog: /var/log/syslog

Los trabajos de los clústeres que se utilizan AWS Batch almacenan en los registros la salida de los trabajos que alcanzaron un RUNNING FAILED estado o un determinado estado. SUCCEEDED CloudWatch El grupo de registros es /aws/batch/job, y el formato del nombre del flujo de registro es jobDefinitionName/default/ecs_task_id. De forma predeterminada, estos registros están configurados para no caducar, pero se puede modificar el periodo de retención. Para obtener más información, consulta Cambiar la retención de datos de registro en CloudWatch los registros en la Guía del usuario de Amazon CloudWatch Logs.

nota

chef-client,cloud-init-output,clustermgtd, computemgtdslurm_resume, y slurm_suspend se agregaron en la AWS ParallelCluster versión 2.9.0. En la AWS ParallelCluster versión 2.6.0, /var/log/cfn-init-cmd.log (cfn-init-cmd) y /var/log/cfn-wire.log (cfn-wire) también se almacenaban en CloudWatch los registros.