Monitoring 部分 - AWS ParallelCluster

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Monitoring 部分

(可选)指定集群的监控设置。

Monitoring: Logs: CloudWatch: Enabled: boolean RetentionInDays: integer DeletionPolicy: string Rotation: Enabled: boolean Dashboards: CloudWatch: Enabled: boolean DetailedMonitoring: boolean Alarms: Enabled: boolean

更新策略:在更新期间不分析此设置。

Monitoring 属性

Logs可选

集群的日志设置。

更新策略:如果更改此设置,则不允许更新。

CloudWatch可选

集群的 CloudWatch 日志设置。

更新策略:如果更改此设置,则不允许更新。

Enabled必需Boolean

如果是true,则集群日志将流式传输到 CloudWatch 日志。默认值为 true

更新策略:如果更改此设置,则不允许更新。

RetentionInDays可选Integer

在日志中保留日志事件的 CloudWatch 天数。默认值为 180。支持的值为 0、1、3、5、7、14、30、60、90、120、150、180、365、400、545、731、1827 和 3653。值为 0 将使用默认的 CloudWatch 日志保留设置,即永不过期。

更新策略:可以在更新期间更改此设置。

DeletionPolicy可选String

表示删除集群时是否删除 CloudWatch 日志上的日志事件。可能的值为 DeleteRetain。默认值为 Retain

更新策略:可以在更新期间更改此设置。

Rotation可选

集群的日志轮换设置。

更新策略:如果更改此设置,则不允许更新。

Enabled必需Boolean

如果为 true,则启用日志轮换。默认为 true。当 AWS ParallelCluster 配置的日志文件达到一定大小时,将对其进行轮换并保留单个备份。有关更多信息,请参阅 AWS ParallelCluster 配置的日志轮换

更新策略:如果更改此设置,则不允许更新。

Dashboards可选

集群的控制面板设置。

更新策略:可以在更新期间更改此设置。

CloudWatch可选

集群的 CloudWatch 仪表板设置。

更新策略:可以在更新期间更改此设置。

Enabled必需Boolean

如果启用true,则 CloudWatch 仪表板已启用。默认值为 true

更新策略:可以在更新期间更改此设置。

DetailedMonitoring可选Boolean

如果设置为true,则会对计算队列 Amazon EC2 实例启用详细监控。启用后,Amazon EC2 控制台会显示每隔 1 分钟监控实例的图表。启用此功能后,会产生额外费用。默认为 false

有关更多信息,请参阅《Amazon Linux 实例EC2用户指南》中的启用或关闭实例的详细监控

更新策略:必须停止计算实例集才能更改此设置以进行更新。

注意

DetailedMonitoring是从 3.6.0 AWS ParallelCluster 版本开始添加的。

Alarms可选

CloudWatch 集群警报。

更新策略:可以在更新期间更改此设置。

Enabled可选

如果是true,则将为集群创建 CloudWatch 警报。默认值为 true

更新策略:可以在更新期间更改此设置。

注意

从 AWS ParallelCluster 版本 3.8.0 开始,将为头节点创建以下警报:Amazon Healt EC2 h Check、CPU /Memory/Disk 使用率和包含所有其他警报的复合警报。