本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
與 Amazon CloudWatch Logs 的整合
從 2.6.0 AWS ParallelCluster 版開始,常用日誌預設會存放在 CloudWatch Logs 中。如需 CloudWatch Logs 的詳細資訊,請參閱 Amazon CloudWatch Logs 使用者指南。若要設定 CloudWatch Logs 整合,請參閱 [cw_log]一節和 cw_log_settings設定。
系統會為每個叢集建立具有名稱的日誌群組 /aws/parallelcluster/
(例如,cluster-name
/aws/parallelcluster/testCluster
)。每個節點上的每個日誌 (如果路徑包含 ,則為一組日誌*
) 都有名為 的日誌串流
。(例如 {hostname}
.{instance_id}
.{logIdentifier}
ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher
。) CloudWatch 代理程式會將日誌資料傳送至 CloudWatch,該代理程式會在所有叢集執行個體root
上執行 。
從 2.10.0 AWS ParallelCluster 版開始,建立叢集時,會建立 Amazon CloudWatch 儀表板。此儀表板可讓您輕鬆檢閱儲存在 CloudWatch Logs 中的日誌。如需詳細資訊,請參閱Amazon CloudWatch 儀表板。
此清單包含可用於平台、排程器和節點之日誌串流的 logIdentifier
和路徑。
平台 | 排程器 | 節點 | 日誌串流 |
---|---|---|---|
amazon centos ubuntu |
awsbatch slurm |
HeadNode |
dcv-authenticator: dcv-ext-authenticator: dcv-agent: dcv-xsession: dcv-server: dcv-session-launcher: Xdcv: cfn-init: Chef-client: |
amazon centos ubuntu |
awsbatch slurm |
ComputeFleet HeadNode |
cloud-init: 受監控: |
amazon centos ubuntu |
slurm |
ComputeFleet |
cloud-init-output: computingmgtd: slurmd: |
amazon centos ubuntu |
slurm |
HeadNode |
clustermgtd: slurm_resume: slurm_suspend: slurmctld: |
amazon centos |
awsbatch slurm |
ComputeFleet HeadNode |
system-messages: |
ubuntu |
awsbatch slurm |
ComputeFleet HeadNode |
syslog: |
叢集中使用 的任務會 AWS Batch 儲存 CloudWatch Logs 中達到 RUNNING
、 SUCCEEDED
或 FAILED
狀態的任務輸出。日誌群組為 /aws/batch/job
,日誌串流名稱格式為
。根據預設,這些日誌設定為永遠不會過期,但您可以修改保留期間。如需詳細資訊,請參閱《Amazon CloudWatch Logs 使用者指南》中的變更 CloudWatch 日誌中的日誌資料保留期間。jobDefinitionName
/default/ecs_task_id
注意
chef-client
2.9.0 cloud-init-output
AWS ParallelCluster 版中slurm_suspend
已新增 clustermgtd
computemgtd
、slurm_resume
、、 和 。對於 2.6.0 AWS ParallelCluster 版, /var/log/cfn-init-cmd.log
(cfn-init-cmd
) 和 /var/log/cfn-wire.log
(cfn-wire
) 也存放在 CloudWatch Logs 中。