监控 Amazon ECS - Amazon Elastic Container Service

监控 Amazon ECS

监控是保持 Amazon ECS 和您的 AWS 解决方案的可靠性、可用性和性能的重要方面。您应从 AWS 解决方案的所有部分收集监控数据,以便更轻松地调试出现的多点故障。在开始监控 Amazon ECS 之前,创建一个其中包括以下问题答案的监控计划:

  • 监控目的是什么?

  • 您将监控哪些资源?

  • 监控这些资源的频率如何?

  • 您将使用哪些监控工具?

  • 谁负责执行监控任务?

  • 出现错误时应通知谁?

可用的指标将取决于集群中任务和服务的启动类型。如果您为服务使用 Fargate 启动类型,则会提供 CPU 和内存利用率指标以帮助监视您的服务。对于 Amazon EC2 启动类型,您将拥有并需要监控构成底层基础设施的 EC2 实例。其他 CPU 以及内存预留和利用率指标可在集群、服务和任务上使用。

下一步,通过在不同时间和不同负载条件下测量性能,在您的环境中建立正常 Amazon ECS 性能的基准。在监控 Amazon ECS 时,存储历史监控数据,以便将此数据与当前性能数据进行比较,确定正常性能模式和性能异常,并设计解决问题的方法。

要建立基准,至少应监控以下项目:

  • 您的 Amazon ECS 集群的 CPU 以及内存预留和利用率指标

  • 您的 Amazon ECS 服务的 CPU 和内存利用率指标

    有关更多信息,请参阅 查看 Amazon ECS 指标