监控 AWS Direct Connect 资源 - AWS Direct Connect

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控 AWS Direct Connect 资源

监控是维护 Direct Connect 资源的可靠性、可用性和性能的重要组成部分。您应该从 AWS 解决方案的所有部分收集监控数据,以便在出现多点故障时可以更轻松地对其进行调试。但是,在开始监控 Direct Connect 之前,您应该创建一个包含以下问题答案的监控计划:

  • 监控目的是什么?

  • 应监控哪些资源?

  • 监控这些资源的频率应如何?

  • 您可以使用哪些监控工具?

  • 谁执行监控任务?

  • 出现错误时应通知谁?

下一步是通过测量不同时间和不同负载条件下的性能,为环境中的正常 Direct Connect 性能建立基准。在监控 Direct Connect 时,存储历史监控数据。这样,您可以将历史监控数据与当前性能数据进行比较,确定性能的正常模式和性能异常,并找出解决问题的方法。

要建立基准,您应该监控物理 Direct Connect 连接的使用情况、状态和运行状况。

监控工具

AWS 提供了可用于监视 AWS Direct Connect 连接的各种工具。您可以配置其中的一些工具来为您执行监控任务,但有些工具需要手动干预。建议您尽可能实现监控任务自动化。

自动监控工具

您可以使用以下自动监控工具来监视 Direct Connect 并在出现问题时进行报告:

  • Amazon CloudWatch 警报 — 在您指定的时间段内观察单个指标。在多个时间段内根据相对于给定阈值的指标值,执行一项或多项操作。该操作是发送给 Amazon SNS 主题的通知。 CloudWatch 警报不会仅仅因为它们处于特定状态就调用操作;该状态必须已更改并保持了指定的时间段。有关可用指标和维度的信息,请参阅 使用 Amazon 进行监控 CloudWatch

  • AWS CloudTrail 日志监控-在账户之间共享日志文件,并通过将 CloudTrail 日志文件发送到 “日志” 来实时监控 CloudWatch 日志文件。您还可以用 Java 编写日志处理应用程序,并验证您的日志文件在交付后是否未更改 CloudTrail。有关更多信息,请参阅记录API通话AWS CloudTrail 用户指南》中的 “使用 CloudTrail 日志文件”。

手动监控工具

监控 AWS Direct Connect 连接的另一个重要部分是手动监控 CloudWatch 警报未涵盖的项目。Direct Connect 和 CloudWatch控制台仪表板提供了 AWS 环境状态的 at-a-glance 视图。

  • 控制 AWS Direct Connect 台显示:

    • 连接状态 (请参阅 State 列)

    • 虚拟接口状态 (请参阅 State 列)

  • CloudWatch 主页显示:

    • 当前告警和状态

    • 告警和资源图表

    • 服务运行状况

    此外,您还可以使用 CloudWatch 执行以下操作:

    • 创建自定义控制面板以监控您关心的服务。

    • 绘制指标数据图,以排除问题并弄清楚趋势。

    • 搜索并浏览您的所有 AWS 资源指标。

    • 创建和编辑告警接收有关问题的通知。