Amazon CloudWatch Logs との統合 - AWS ParallelCluster

Amazon CloudWatch Logs との統合

CloudWatch Logs の詳細については、「Amazon CloudWatch Logs User Guide」(Amazon CloudWatch Logs ユーザーガイド) を参照してください。CloudWatch Logs の統合を設定するには、「Monitoring」セクションを参照してください。append-config を使用して CloudWatch 設定にカスタムログを追加する方法については、「Amazon CloudWatch ユーザーガイド」の「 CloudWatch エージェント設定ファイル」を参照してください。

Amazon CloudWatch Logs のクラスターログ

ロググループは、クラスターごとに /aws/parallelcluster/cluster-name-<timestamp> という名前 (例: /aws/parallelcluster/testCluster-202202050215) で作成されます。ノード別の各ログ (またはパスに * が含まれている場合はログのセット) には、{hostname}.{instance_id}.{logIdentifier} という名前のログストリームが存在します。(例: ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher) ログデータは、すべてのクラスターインスタンス上で root として実行される CloudWatch エージェントによって CloudWatch に送信されます。

Amazon CloudWatch ダッシュボードは、クラスター作成時に作成されます。このダッシュボードでは、CloudWatch Logs に保存されているログを確認することができます。詳細については、「Amazon CloudWatch ダッシュボード」を参照してください。

このリストには、プラットフォーム、スケジューラー、ノードで使用できるログストリームの logIdentifier とパスが含まれています。

プラットフォーム、スケジューラー、ノードで使用できるログストリーム
[Platforms] (プラットフォーム) スケジューラ ノード ログストリーム

Amazon

redhat

Ubuntu

awsbatch

slurm

HeadNode

dcv-authenticator: /var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

dcv-agent: /var/log/dcv/agent.*.log

dcv-xsession: /var/log/dcv/dcv-xsession.*.log

dcv-server: /var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

Xdcv: /var/log/dcv/Xdcv.*.log

cfn-init: /var/log/cfn-init.log

chef-client: /var/log/chef-client.log

Amazon

redhat

Ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

cloud-init: /var/log/cloud-init.log

supervisord: /var/log/supervisord.log

Amazon

redhat

Ubuntu

slurm

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

computemgtd: /var/log/parallelcluster/computemgtd

slurmd: /var/log/slurmd.log

slurm_prolog_epilog: /var/log/parallelcluster/slurm_prolog_epilog.log

Amazon

redhat

Ubuntu

slurm

HeadNode

sssd: /var/log/sssd/sssd.log

sssd_domain_default: /var/log/sssd/sssd_default.log

pam_ssh_key_generator: /var/log/parallelcluster/pam_ssh_key_generator.log

clusterstatusmgtd: /var/log/parallelcluster/clusterstatusmgtd

clustermgtd: /var/log/parallelcluster/clustermgtd

compute_console_output: /var/log/parallelcluster/compute_console_output

slurm_resume: /var/log/parallelcluster/slurm_resume.log

slurm_suspend: /var/log/parallelcluster/slurm_suspend.log

slurmctld: /var/log/slurmctld.log

slurm_fleet_status_manager: /var/log/parallelcluster/slurm_fleet_status_manager.log

Amazon

redhat

awsbatch

slurm

ComputeFleet

HeadNode

system-messages: /var/log/messages

Ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

syslog: /var/log/syslog

AWS Batch を使用するクラスターのジョブは、RUNNINGSUCCEEDED、または FAILED の状態に達したジョブの出力を CloudWatch Logs に保存します。ロググループは /aws/batch/job、ログストリーム名形式は jobDefinitionName/default/ecs_task_id です。デフォルトでは、このログは失効しませんが、保持期間を変更することもできます。詳細については、「Amazon CloudWatch Logs User Guide」(Amazon CloudWatch Logs ユーザーガイド) の「Change log data retention in CloudWatch Logs」(CloudWatch ログでのログデータ保管期間の変更) を参照してください。

Amazon CloudWatch Logs のビルドイメージログ

カスタムビルドイメージごとに /aws/imagebuilder/ParallelClusterImage-<image-id> という名前が付けられたロググループが作成されます。{pcluster-version}/1 という名前のユニークなログストリームには、ビルドイメージプロセスの出力が含まれます。

ログには、pcluster イメージコマンドを使用してアクセスできます。詳細については、「AWS ParallelCluster AMI カスタマイズ」を参照してください。