與 Amazon CloudWatch Logs 的整合 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

與 Amazon CloudWatch Logs 的整合

從 2.6.0 AWS ParallelCluster 版開始,常用日誌預設會存放在 CloudWatch Logs 中。如需 CloudWatch Logs 的詳細資訊,請參閱 Amazon CloudWatch Logs 使用者指南。若要設定 CloudWatch Logs 整合,請參閱 [cw_log]一節cw_log_settings設定。

系統會為每個叢集建立具有名稱的日誌群組 /aws/parallelcluster/cluster-name(例如,/aws/parallelcluster/testCluster)。每個節點上的每個日誌 (如果路徑包含 ,則為一組日誌*) 都有名為 的日誌串流{hostname}.{instance_id}.{logIdentifier}。(例如 ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher。) CloudWatch 代理程式會將日誌資料傳送至 CloudWatch,該代理程式會在所有叢集執行個體root上執行 。

從 2.10.0 AWS ParallelCluster 版開始,建立叢集時,會建立 Amazon CloudWatch 儀表板。此儀表板可讓您輕鬆檢閱儲存在 CloudWatch Logs 中的日誌。如需詳細資訊,請參閱Amazon CloudWatch 儀表板

此清單包含可用於平台、排程器和節點之日誌串流的 logIdentifier 和路徑。

可用於平台、排程器和節點的日誌串流
平台 排程器 節點 日誌串流

amazon

centos

ubuntu

awsbatch

slurm

HeadNode

dcv-authenticator: /var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

dcv-agent: /var/log/dcv/agent.*.log

dcv-xsession: /var/log/dcv/dcv-xsession.*.log

dcv-server: /var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

Xdcv: /var/log/dcv/Xdcv.*.log

cfn-init: /var/log/cfn-init.log

Chef-client: /var/log/chef-client.log

amazon

centos

ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

cloud-init: /var/log/cloud-init.log

受監控: /var/log/supervisord.log

amazon

centos

ubuntu

slurm

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

computingmgtd: /var/log/parallelcluster/computemgtd

slurmd: /var/log/slurmd.log

amazon

centos

ubuntu

slurm

HeadNode

clustermgtd: /var/log/parallelcluster/clustermgtd

slurm_resume: /var/log/parallelcluster/slurm_resume.log

slurm_suspend: /var/log/parallelcluster/slurm_suspend.log

slurmctld: /var/log/slurmctld.log

amazon

centos

awsbatch

slurm

ComputeFleet

HeadNode

system-messages: /var/log/messages

ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

syslog: /var/log/syslog

叢集中使用 的任務會 AWS Batch 儲存 CloudWatch Logs 中達到 RUNNINGSUCCEEDEDFAILED 狀態的任務輸出。日誌群組為 /aws/batch/job,日誌串流名稱格式為 jobDefinitionName/default/ecs_task_id。根據預設,這些日誌設定為永遠不會過期,但您可以修改保留期間。如需詳細資訊,請參閱《Amazon CloudWatch Logs 使用者指南》中的變更 CloudWatch 日誌中的日誌資料保留期間

注意

chef-client2.9.0 cloud-init-output AWS ParallelCluster 版中slurm_suspend已新增 clustermgtdcomputemgtdslurm_resume、、 和 。對於 2.6.0 AWS ParallelCluster 版, /var/log/cfn-init-cmd.log(cfn-init-cmd) 和 /var/log/cfn-wire.log(cfn-wire) 也存放在 CloudWatch Logs 中。