监控 Kinesis 代理运行状况 - Amazon Data Firehose

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控 Kinesis 代理运行状况

Kinesis 代理以 AWSKinesisAgent 命名空间发布自定义 CloudWatch 指标。该代理可帮助您评测代理运行是否正常、是否按指定方式将数据提交到 Amazon Data Firehose,以及在数据创建器上是否使用适当数量的 CPU 和内存资源。

记录数和发送的字节数等指标对于了解代理将数据提交到 Firehose 流的速率非常有用。当这些指标低于预期阈值一定的百分比或者降低为零时,可能表明存在配置问题、网络错误或代理运行状况问题。诸如主机上的 CPU 和内存消耗以及代理错误计数器等指标可用于指示数据创建器资源使用情况,并提供对潜在的配置或主机错误的深入分析。最后,代理还会记录服务异常,以帮助调查代理问题。

代理指标在代理配置设置 cloudwatch.endpoint 指定的区域中报告。有关更多信息,请参阅 指定代理配置设置

从多个 Kinesis 代理发布的 Cloudwatch 指标是聚合或合并的。

对于默认启用的 Kinesis 代理发出的指标,会收取一定的费用。有关更多信息,请参阅 Amazon CloudWatch 定价

使用 CloudWatch 进行监控

Kinesis 代理会向 CloudWatch 发送以下指标。

指标 描述
BytesSent

在指定时段内发送到 Firehose 流的字节数。

单位:字节

RecordSendAttempts

在指定的时间范围内对 PutRecordBatch 的一次调用中尝试的记录数(第一次,或者作为重试)。

单位:计数

RecordSendErrors

在指定时间范围内对 PutRecordBatch 的一次调用中返回故障状态的记录数,包括重试。

单位:计数

ServiceErrors

在指定时间范围内产生服务错误(限制错误之外的其他错误)的 PutRecordBatch 调用次数。

单位:计数