Amazon Managed Service for Apache Flink 之前称为 Amazon Kinesis Data Analytics for Apache Flink。
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
要保持Managed Service for Apache Flink的应用程序的可靠性、可用性和性能,监控是一个重要环节。您应该从 AWS 解决方案的所有部分收集监控数据,以便在出现多点故障时可以更轻松地进行调试。
在开始监控Managed Service for Apache Flink之前,您应该创建一个监控计划,其中包括以下问题的答案:
-
监控目的是什么?
-
您将监控哪些资源?
-
监控这些资源的频率如何?
-
您将使用哪些监控工具?
-
谁负责执行监控任务?
-
出现错误时应通知谁?
下一步是为您环境中正常的Managed Service for Apache Flink的性能设置基准。您可以通过在不同时间和不同负载条件下衡量性能来获得这一基准。在监控Managed Service for Apache Flink时,您可以存储历史监控数据。然后,您可以将其与当前性能数据进行比较,确定正常的性能模式和性能异常,并找出解决问题的方法。