使用 Amazon CloudWatch 监控 Run Command 指标 - AWS Systems Manager

使用 Amazon CloudWatch 监控 Run Command 指标

指标是 Amazon CloudWatch 中的基本概念。指标表示一个发布到 CloudWatch 并且按时间排序的数据点集。可将指标视为要监控的变量,而数据点代表该变量随时间变化的值。

AWS Systems Manager 会将与 Run Command 命令的状态有关的指标发布到 CloudWatch,使您能够根据这些指标设置告警。Run Command 是 AWS Systems Manager 的一项功能。这些统计数据会被长时间记录,以便您可以访问历史信息并更好地了解 AWS 账户中命令运行的成功率。

可以跟踪其指标的命令的终端状态值包括 SuccessFailedDelivery Timed Out。例如,对于设置为每小时运行一次的 SSM Command 文档,您可以配置告警,以便在其中任何一小时未报告 Success 的状态时向您发送通知。有关命令状态值的更多信息,请参阅 了解命令状态

在 CloudWatch 控制台中查看指标
  1. 访问 https://console.aws.amazon.com/cloudwatch/ 打开 CloudWatch 控制台。

  2. 在导航窗格中,选择指标

  3. 按 AWS 服务告警区域,对于服务,选择 SSM-Run Command

使用 AWS CLI 查看指标

打开命令提示符窗口并使用以下命令。

aws cloudwatch list-metrics --namespace "AWS/SSM-RunCommand"

要列出所有可用的指标,请使用以下命令。

aws cloudwatch list-metrics

Systems Manager Run Command 指标和维度

Systems Manager 每分钟向 CloudWatch 发送一次 Run Command 命令指标。

Systems Manager 将以下命令指标发送到 CloudWatch。

注意

这些指标使用 Count 作为单位,因此 SumSampleCount 是最有用的统计数据。

指标 描述
CommandsDeliveryTimedOut 终端状态为 Delivery Timed Out 的命令的数量。
CommandsFailed 终端状态为 Failed 的命令的数量。
CommandsSucceeded 终端状态为 Success 的命令的数量。

有关使用 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 用户指南中的以下主题: