本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
监控 AWS 服务是保持系统健康和最佳运行的重要组成部分。最好从 AWS 解决方案的各个部分收集监控数据,以便在发生故障或性能下降时更容易调试或修复。在开始监控您的 AWS 解决方案之前,我们建议您思考并回答以下问题:
-
监控目的是什么?
-
您要监控什么资源?
-
您将以什么样的频率监控这些资源?
-
您将使用哪些监控工具?
-
由谁负责执行监控?
-
发生错误时通知谁?以何种方式发送通知?
要了解当前的性能模式,判断性能异常表现,并构想问题解决方法,您应该针对不同时间和不同负载条件设定基准性能指标。当您监控 AWS 解决方案时,我们建议您存储历史监控数据,这些数据既可以供日后参考,也可帮助您设定基准。
通常,性能指标的可接受值取决于您的基准性能以及应用程序执行的操作。应调查相对于基准性能的一致或趋势性变化。有关特定指标类型的建议如下:
-
高 CPU 或 RAM 使用 — 较高的 CPU 或 RAM 使用值可能是正常情况,只要它们符合您的应用程序的目标(如吞吐量或并发度)并且是预期情况即可。
-
存储卷消耗 — 如果使用的空间始终不低于总存储卷空间的 85%,调查存储消耗量 (
VolumeBytesUsed
)。确定是可以从存储卷中删除数据还是可以将数据存档到其他系统以释放空间。有关更多信息,请参阅Amazon DocumentDB 存储 和Amazon DocumentDB 配额和限制。 -
网络流量 — 对于网络流量,请与系统管理员讨论,以了解域网络和互联网连接的预期吞吐量。如果吞吐量始终低于预期,则应调查网络流量。
-
数据库连接 — 如果发现用户连接数较高,同时实例性能下降并且响应时间延长,请考虑约束数据库连接。实例的最佳用户连接数因实例类和所执行操作的复杂性而异。
-
IOPS 指标 — IOPS 指标的预期值取决于磁盘规格和服务器配置,因此,请使用您的基准来了解典型状况。调查一下值是否始终与您的基准不同。为获得最佳 IOPS 性能,请确保典型工作集与内存大小相适,以最大限度地减少读取和写入操作。
亚马逊 DocumentDB(兼容 MongoDB)提供了各种亚马逊指标,您可以监控这些 CloudWatch 指标,以确定亚马逊 DocumentDB 集群和实例的运行状况和性能。您可以使用各种工具查看亚马逊 DocumentDB 指标,包括亚马逊 DocumentDB 控制台 AWS CLI CloudWatch 、API 和 Performance Insights。