使用 Amazon 监控堆栈 CloudWatch - AWS OpsWorks

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon 监控堆栈 CloudWatch

重要

该 AWS OpsWorks Stacks 服务于 2024 年 5 月 26 日终止,新客户和现有客户均已禁用。我们强烈建议客户尽快将其工作负载迁移到其他解决方案。如果您对迁移有疑问,请通过 re AWS : Post 或通过 Pre mium Su AWS pp ort 与 AWS Support 团队联系。

AWS OpsWorks 堆栈使用 Amazon CloudWatch (CloudWatch) 来监控堆栈。

  • 对于 Linux 堆栈, AWS OpsWorks Stacks 支持 13 个自定义指标,以提供堆栈中每个实例的详细监控,并在 “监控” 页面上汇总数据,方便您使用。

  • 对于 Windows 堆栈,您可以使用CloudWatch 控制台监控实例的标准 Amazon EC2 指标。

    Monitoring 页面不会显示 Windows 指标。

监控” 页面显示整个堆栈、层或实例的指标。 AWS OpsWorks 堆栈指标不同于 Amazon EC2 指标。您也可以通过 CloudWatch 控制台启用其他指标,但这些指标通常需要额外收费。您还可以在 CloudWatch 控制台上查看底层数据,如下所示:

要在中查看 OpsWorks 自定义指标 CloudWatch
  1. 打开 CloudWatch 控制台,网址为 https://console.aws.amazon.com/cloudwatch/

  2. 在导航栏中,选择堆栈的区域。

  3. 在导航窗格中,选择指标

  4. 在 OpsWorks指标中,选择实例指标层指标堆栈指标

CloudWatch metrics summary showing 362 total metrics across EBS, EC2, ElastiCache, and OpsWorks categories.
注意

AWS OpsWorks Stacks 通过在每个实例(实例代理)上运行一个进程来收集指标。由于使用虚拟机管理程序 CloudWatch 收集指标的方式不同,因此控制台中的值可能与 AWS OpsWorks Stacks CloudWatch 控制台的 “监控” 页面上的相应值略有不同。

您也可以使用 CloudWatch 控制台设置警报。有关如何创建警报的更多信息,请参阅创建 Amazon CloudWatch 警报。有关 CloudWatch 自定义指标的列表,请参阅 AWS OpsWorks 指标和维度。有关更多信息,请参阅 Amazon CloudWatch

AWS OpsWorks 堆栈指标

AWS OpsWorks Stacks CloudWatch 每五分钟向其发送一次以下指标。

CPU 指标
指标 描述

cpu_idle

CPU 空闲时间的百分比。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

cpu_nice

CPU 处理具有正 nice 值且调度优先级较低的进程的时间百分比。关于更多衡量内容的信息,请参阅 nice (Unix)

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

cpu_steal

随着 AWS 在越来越多的实例中分配虚拟机管理程序 CPU 资源,虚拟化负载会增加,并可能影响虚拟机管理程序在实例上执行请求工作的频率。cpu_steal 衡量实例等待虚拟机管理程序分配物理 CPU 资源的时间百分比。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

cpu_system

CPU 正处理系统操作的时间百分比。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

cpu_user

CPU 正处理用户操作的时间百分比。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

cpu_waitio

CPU 等待输入/输出操作完成的时间百分比。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

内存指标
指标 描述

memory_buffers

缓冲内存量。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

memory_cached

缓存的内存量。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

memory_free

可用内存量。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

memory_swap

交换空间量。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

memory_total

内存的总量。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

memory_used

使用中的内存量。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

负载指标
指标 描述

load_1

一分钟窗口内的平均负载。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

load_5

五分钟窗口内的平均负载。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

load_15

15 分钟窗口内的平均负载。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

进程指标
指标 描述

procs

活动进程的数量。

有效维度:您正在查看其指标的各个资源的 ID: StackId LayerId、或 InstanceId。

有效统计数据:Average, Minimum, Maximum, Sum, or Data Samples

单位:无

AWS OpsWorks 堆栈指标的维度

AWS OpsWorks 堆栈指标使用 AWS OpsWorks Stacks 命名空间,并为以下维度提供指标:

维度 描述

StackId

堆栈的平均值。

LayerId

分层的平均值。

InstanceId

实例的平均值。

堆栈指标

要查看整个堆栈的指标摘要,请在堆栈控制面板中选择一个堆栈,然后在导航窗格中单击监控。 AWS OpsWorks 以下示例针对的是具有 PHP 和 DB 层的堆栈。

Monitoring dashboard showing CPU, memory, load, and process metrics over time.

堆栈视图针对每个层显示了指定时间段 (1 小时、8 小时、24 小时、1 周或 2 周) 内四个类型的指标的图表。请注意以下几点:

  • AWS OpsWorks Stacks 会定期更新图表;右上角的倒计时器表示距离下次更新的剩余时间,

  • 如果某个层具有多个实例,则图表将显示该层的平均值。

  • 您可以通过单击右上角的列表并选择您首选的值来指定时间段。

对于每个指标类型,您可以使用图表顶部的列表来选择要查看的特定指标。

层指标

要查看特定层的指标,请单击 Monitoring Layers 视图中的层名称。以下示例显示了 PHP 层的指标,该层有两个实例。

Monitoring dashboard showing CPU, memory, load, and processes for two PHP app server instances over time.

这些指标类型与堆栈指标的类型相同,对于每种类型,您都可以使用图表顶部的列表来选择要查看的特定指标。

注意

您也可以显示层指标,方法是转到层的详细信息页面并单击右上角的 Monitoring

实例指标

要查看特定实例的指标,请单击层监控视图中的实例名称。以下示例显示了 PHP 层的 php-app1 实例的指标。

Dashboard showing CPU, memory, load, and process metrics for a PHP application instance.

这些图表汇总了每个指标类型的所有可用指标。要获取特定时间点的准确值,请使用鼠标将滑块 (在上图中以红色箭头表示) 移动到合适的位置。

注意

您也可以显示实例指标,方法是转到实例的详细信息页面并选择右上角的 Monitoring