本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 CloudWatch 进行仪表板和可视
仪表板可帮助您快速关注应用程序和工作负载的关注领域。CloudWatch 提供了自动仪表板,您还可以轻松创建使用 CloudWatch 指标。 CloudWatch 仪表板提供的洞察力比单独查看指标更多,因为它们可以帮助您关联多个指标并确定趋势。例如,包含已接收订单、内存、CPU 利用率和数据库连接的仪表板可以帮助您跨多个关联工作负载指标的变化AWS当您的订单数量增加或减少时的资源。
您应该在账户和应用程序级别创建仪表板来监控工作负载和应用程序。您可以使用开始使用 CloudWatch 自动仪表板,它们是AWS预先配置了服务特定指标的服务级别仪表板。自动服务仪表板显示所有标准 CloudWatch 服务的指标。自动仪表板将绘制每个服务指标使用的所有资源,并帮助您快速识别账户中的异常值资源。这可以帮助您识别利用率高和低利用率的资源,从而帮助您优化成本。
创建跨服务控制面板
您可以通过查看自动服务级别控制面板来创建跨服务仪表板AWS服务和使用添加到控制面板选项来自操作菜单。然后,您可以将其他自动仪表板中的指标添加到新仪表板中,并删除指标以缩小仪表板的焦点。您还应该添加自己的自定义指标来跟踪关键观察结果(例如,收到的订单或每秒交易量)。创建自己的自定义跨服务仪表板可帮助您专注于与工作负载最相关的指标。我们建议您创建账户级的跨服务仪表板,其中涵盖关键指标并显示账户中的所有工作负载。
如果您的云运营团队有中央办公空间或公共区域,则可以显示 CloudWatch 大型电视显示器上的仪表板以全屏模式自动刷新。
创建应用程序或工作负载特定仪
我们建议您创建特定于应用程序和工作负载的仪表板,重点关注生产环境中每个关键应用程序或工作负载的关键指标和资源。应用程序和工作负载特定仪表板专注于自定义应用程序或工作负载指标AWS影响其性能的资源指标。
你应该定期评估和自定义 CloudWatch 应用程序或工作负载仪表板,可在事件发生后跟踪关键 在引入或停用功能时,还应更新特定于应用程序或工作负载的仪表板。除了记录和监控之外,对工作负载和特定于应用程序的仪表板的更新应该是持续提高质量的必要活动。
创建跨账户或跨区域的控制面板
AWS资源主要是区域性的,指标、警报和仪表板特定于部署资源的区域。这可能需要您更改区域以查看跨区域工作负载和应用程序的指标、仪表板和警报。如果将应用程序和工作负载分成多个帐户,则可能还需要重新进行身份验证并登录每个帐户。但是, CloudWatch 支持从单个账户查看跨账户和跨区域数据,这意味着您可以在单个账户和区域中查看指标、警报、仪表板和日志小部件。如果你有一个集中的日志记录和监控帐户,这非常有用。
账户所有者和应用程序团队所有者应为特定于账户的跨区域应用程序创建仪表板,以便在集中位置有效监控关键指标。CloudWatch 仪表板自动支持跨区域小部件,这意味着您可以创建包含来自多个区域的指标的仪表板,而无需进一步配
一个重要的例外是 CloudWatch 日志见解小组件,因为只能为您当前登录的账户和地区显示日志数据。您可以使用指标筛选器从日志中创建特定于区域的指标,这些指标可以显示在跨区域控制面板上。然后,当你需要进一步分析这些日志时,你可以切换到特定的区域。
运营团队应创建集中式控制面板,以监控重要的跨账户和跨区域指标。例如,您可以创建一个跨账户控制面板,其中包括每个账户和区域的总 CPU 利用率。您还可以使用指标数学跨多个账户和地区聚合和控制数据。
使用指标数学来微调可观察性和警报
您可以使用指标数学来帮助计算与工作负载相关的格式和表达式中的指标。计算的指标可以保存并在仪表板上查看,以便进行跟踪。例如,标准的 Amazon EBS 数量指标提供了读取数量 (VolumeReadOps
) 然后写 (VolumeWriteOps
) 在特定时间段内执行的操作。
但是,AWS提供了有关 IOPS 中 Amazon EBS 卷性能的指南。您可以在指标数学中绘制并计算 Amazon EBS 体积的 IOPS,方法是添加VolumeReadOps
和VolumeWriteOps
然后除以为这些指标选择的时间段。
在此示例中,我们总结期间内的 IOPS,然后除以期间长度以获得 IOPS。然后,您可以针对此指标数学表达式设置警报,以便在卷的 IOPS 接近其卷类型的最大容量时提醒您。有关使用指标数学监控 Amazon Elastic File System (Amazon EFS) 文件系统的更多信息和示例 CloudWatch 指标,请参阅亚马逊 CloudWatch 指标数学简化了对 Amazon EFS 文件系统的近实时监控等
使用适用于 Amazon ECS、Amazon EKS 和 Lambda 的自动控制面板 CloudWatchContainer 见解和 CloudWatch Lambda Insights
CloudWatch 容器见解为在 Amazon ECS 和 Amazon EKS 上运行的容器工作负载创建动态、自动控制面板。您应该启用容器 Insights,以便能够观察 CPU、内存、磁盘、网络和诊断信息,例如容器重启失败。容器见解会生成动态仪表板,您可以在集群、容器实例或节点、服务、任务、容器和单个容器级别快速筛选这些仪表板。Container Insights在群集和节点或容器实例级别配置这取决于AWS服务。
类似于容器见解, CloudWatch Lambda Insights 为您的 Lambda 函数创建动态、自动的仪表板。此解决方案收集、聚合和汇总系统级指标,包括 CPU 时间、内存、磁盘和网络。它还收集、聚合和汇总诊断信息(如冷启动和 Lambda 工件关闭),以帮助您隔离和快速解决 Lambda 函数的问题。Lambda 已在函数级别启用,不需要任何代理。
容器见解和 Lambda Insights 还可以帮助您快速切换到应用程序或性能日志、X-Ray 跟踪和服务映射以可视化容器工作负载。他们都使用 CloudWatch 要捕获的嵌入式指标格式 CloudWatch 指标和性能日志。
你可以创建共享 CloudWatch 使用容器见解和 Lambda Insights 捕获的指标的工作负载仪表板。您可以通过筛选和查看自动控制面板来达到此目的。 CloudWatch 容器见解,然后选择添加到仪表板选项允许您将显示的指标添加到标准 CloudWatch 控制面板。然后,您可以删除或自定义指标并添加其他指标以正确表示您的工作负载。