Amazon CloudWatch Logs との統合 - AWS ParallelCluster

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon CloudWatch Logs との統合

AWS ParallelCluster バージョン 2.6.0 以降、共通ログはデフォルトで CloudWatch Logs に保存されます。CloudWatch Logs の詳細については、「Amazon CloudWatch Logs User Guide」(Amazon CloudWatch Logs ユーザーガイド) を参照してください。CloudWatch Logs の統合を設定するには、[cw_log] セクションcw_log_settings 設定を参照してください。

ロググループは、クラスターごとに /aws/parallelcluster/cluster-name という名前 (例: /aws/parallelcluster/testCluster) で作成されます。ノード別の各ログ (またはパスに * が含まれている場合はログのセット) には、{hostname}.{instance_id}.{logIdentifier} という名前のログストリームが存在します。(例: ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher) ログデータは、すべてのクラスターインスタンス上で root として実行される CloudWatch エージェントによって CloudWatch に送信されます。

AWS ParallelCluster バージョン 2.10.0 以降では、クラスターの作成時に Amazon CloudWatch ダッシュボードが作成されます。このダッシュボードでは、CloudWatch Logs に保存されているログを簡単に確認することができます。詳細については、「Amazon CloudWatch ダッシュボード」を参照してください。

このリストには、プラットフォーム、スケジューラー、ノードで使用できるログストリームの logIdentifier とパスが含まれています。

プラットフォーム、スケジューラー、ノードで使用できるログストリーム
[Platforms] (プラットフォーム) スケジューラ ノード ログストリーム

Amazon

CentOS

Ubuntu

awsbatch

slurm

HeadNode

dcv-authenticator: /var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

dcv-agent: /var/log/dcv/agent.*.log

dcv-xsession: /var/log/dcv/dcv-xsession.*.log

dcv-server: /var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

Xdcv: /var/log/dcv/Xdcv.*.log

cfn-init: /var/log/cfn-init.log

chef-client: /var/log/chef-client.log

Amazon

CentOS

Ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

cloud-init: /var/log/cloud-init.log

supervisord: /var/log/supervisord.log

Amazon

CentOS

Ubuntu

slurm

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

computemgtd: /var/log/parallelcluster/computemgtd

slurmd: /var/log/slurmd.log

Amazon

CentOS

Ubuntu

slurm

HeadNode

clustermgtd: /var/log/parallelcluster/clustermgtd

slurm_resume: /var/log/parallelcluster/slurm_resume.log

slurm_suspend: /var/log/parallelcluster/slurm_suspend.log

slurmctld: /var/log/slurmctld.log

Amazon

CentOS

awsbatch

slurm

ComputeFleet

HeadNode

system-messages: /var/log/messages

Ubuntu

awsbatch

slurm

ComputeFleet

HeadNode

syslog: /var/log/syslog

を使用するクラスター内のジョブは、RUNNING、、SUCCEEDEDまたは FAILED状態に達したジョブの出力を CloudWatch Logs に AWS Batch 保存します。ロググループは /aws/batch/job、ログストリーム名形式は jobDefinitionName/default/ecs_task_id です。デフォルトでは、このログは永久に失効しませんが、保持期間を変更することもできます。詳細については、「Amazon CloudWatch Logs User Guide」(Amazon CloudWatch Logs ユーザーガイド) の「Change log data retention in CloudWatch Logs」(CloudWatch ログでのログデータ保管期間の変更) を参照してください。

注記

chef-client AWS ParallelCluster バージョン 2.9.0 ではcloud-init-outputclustermgtdcomputemgtd、、、slurm_resume、、、および が追加されslurm_suspendました。 AWS ParallelCluster バージョン 2.6.0 では、/var/log/cfn-init-cmd.log (cfn-init-cmd) と/var/log/cfn-wire.log (cfn-wire) も CloudWatch Logs に保存されました。