使用 CloudWatch 指标进行监控 - Amazon CloudWatch 日志

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 CloudWatch 指标进行监控

您可以使用本节中的表来查看 Amazon CloudWatch Logs 每分钟发送到 Amazon CloudWatch 的指标。

CloudWatch Logs 指标

AWS/Logs 命名空间包括以下指标。

指标 描述

CallCount

在您账户中执行的指定 API 操作的数量。

CallCount 为 CloudWatch Logs 服务使用量指标。有关更多信息,请参阅 CloudWatch Logs 服务使用情况指标

有效维度:类、资源、服务、类型

有效统计数据:Sum

单位:无

DeliveryErrors

在将数据转发到订阅目标时,CloudWatch Logs 收到其错误的日志事件的数量。如果目标服务返回一个可重试错误,如限制异常或可重试服务异常(如 HTTP 5xx),则 CloudWatch Logs 将继续重试传输长达 24 小时。如果错误是不可重试错误(例如 AccessDeniedExceptionResourceNotFoundException),则 CloudWatch Logs 不会尝试重试传输。

有效维度:LogGroupName、DestinationType、FilterName、PolicyLevel

有效统计数据:Sum

单位:无

DeliveryThrottling

在将数据转发到订阅目标时,CloudWatch Logs 因为其而被限制的日志事件的数量。

如果目标服务返回一个可重试错误,如限制异常或可重试服务异常(如 HTTP 5xx),则 CloudWatch Logs 将继续重试传输长达 24 小时。如果错误是不可重试错误(例如 AccessDeniedExceptionResourceNotFoundException),则 CloudWatch Logs 不会尝试重试传输。

有效维度:LogGroupName、DestinationType、FilterName、PolicyLevel

有效统计数据:Sum

单位:无

EMFParsingErrors

处理嵌入式指标格式日志时遇到的解析错误数量。当日志被识别为嵌入式指标格式但不遵循正确的格式时,就会发生此类错误。有关嵌入式指标格式的更多信息,请参阅规范:嵌入式指标格式

有效维度:LogGroupName

有效统计数据:Sum

单位:无

EMFValidationErrors

处理嵌入式指标格式日志时遇到的验证错误数量。当嵌入式指标格式日志中的指标定义不遵循嵌入式指标格式和 MetricDatum 规范时,就会出现这些错误。有关 CloudWatch 嵌入式指标格式的信息,请参阅规范:嵌入式指标格式。有关数据类型 MetricDatum 的信息,请参阅 Amazon CloudWatch API 参考中的 MetricDatum

注意

某些验证错误可能导致 EMF 日志中的多个指标未发布。例如,所有使用无效命名空间设置的指标均将被删除。

有效维度:LogGroupName

有效统计数据:Sum

单位:无

ErrorCount

在您账户中执行的导致了错误的 API 操作的数量。

ErrorCount 为 CloudWatch Logs 服务使用量指标。有关更多信息,请参阅 CloudWatch Logs 服务使用情况指标

有效维度:类、资源、服务、类型

有效统计数据:Sum

单位:无

ForwardedBytes

以压缩字节转发到订阅目标的日志事件的容量。

有效维度:LogGroupName、DestinationType、FilterName

有效统计数据:Sum

单位:字节

ForwardedLogEvents

转发到订阅目标的日志事件的数量。

有效维度:LogGroupName、DestinationType、FilterName、PolicyLevel

有效统计数据:Sum

单位:无

IncomingBytes

以未压缩字节上传到 CloudWatch Logs 的日志事件的容量。当用于 LogGroupName 维度时,这是以未压缩字节上传到日志组的日志事件的容量。

有效维度:LogGroupName

有效统计数据:Sum

单位:字节

IncomingLogEvents

上传到 CloudWatch Logs 的日志事件的数量。当用于 LogGroupName 维度时,这是上传到日志组的日志事件的数量。

有效维度:LogGroupName

有效统计数据:Sum

单位:无

LogEventsWithFindings

与您正使用 CloudWatch Logs 数据保护功能审计的数据字符串相匹配的日志事件数量。有关更多信息,请参阅 通过屏蔽帮助保护敏感的日志数据

有效维度:无

有效统计数据:Sum

单位:无

ThrottleCount

因使用量配额而被限制在您账户中执行的 API 操作数量。

ThrottleCount 为 CloudWatch Logs 服务使用量指标。有关更多信息,请参阅 CloudWatch Logs 服务使用情况指标

有效维度:类、资源、服务、类型

有效统计数据:Sum

单位:无

CloudWatch Logs 指标的维度

下表列出了可与 CloudWatch Logs 指标一起使用的维度。

维度 描述
LogGroupName

要显示其指标的 CloudWatch Logs 日志组的名称。

DestinationType

CloudWatch Logs 数据的订阅目标,可以是 AWS Lambda、Amazon Kinesis Data Streams 或 Amazon Data Firehose。

FilterName

将数据从日志组转发到目标的订阅筛选器的名称。订阅筛选条件名称将由 CloudWatch 自动转换为 ASCII,且任何不受支持的字符将被替换为问号 (?)。

下表列出了与账户级订阅筛选条件相关的指标维度。

维度 描述
PolicyLevel

策略适用的级别。目前,此维度的唯一有效值是 AccountPolicy

DestinationType

CloudWatch Logs 数据的订阅目标,可以是 AWS Lambda、Amazon Kinesis Data Streams 或 Amazon Data Firehose。

FilterName

将数据从日志组转发到目标的订阅筛选器的名称。订阅筛选条件名称将由 CloudWatch 自动转换为 ASCII,且任何不受支持的字符将被替换为问号 (?)。

CloudWatch Logs 服务使用情况指标

CloudWatch Logs 将指标发送到 CloudWatch,用于跟踪使用情况 CloudWatch Logs API 操作。这些指标与 AWS 服务配额对应。跟踪这些指标可帮助您主动管理配额。有关更多信息,请参阅 Service Quotas 集成和使用量指标

例如,您可以跟踪 ThrottleCount 指标或为该指标设置警报。如果该指标的值上升,则应考虑为受到限制的 API 操作请求增加配额。有关 CloudWatch Logs 服务配额的更多信息,请参阅 CloudWatch Logs 配额

CloudWatch Logs 在 AWS/UsageAWS/Logs 命名空间中每分钟发布一次服务配额使用量指标。

下表列出了 CloudWatch Logs 所发布的服务使用量指标。这些指标没有指定的单位。指标中最实用的统计数据是 SUM,它表示以 1 分钟为间隔的总操作数。

这些指标中的每个指标都会发布,其中包含所有 ServiceClassTypeResource 维度的值。它们还与一个名为 Account Metrics 的单一维度一同发布。使用 Account Metrics 维度来查看您账户中所有 API 操作的指标总和。使用其他维度并指定 Resource 维度的 API 操作名称,以查找该特定 API 的指标。

指标

指标 描述

CallCount

在您的账户中执行的指定操作的数量。

CallCount 同时发布在 AWS/UsageAWS/Logs 命名空间中。

ErrorCount

在您账户中执行的导致了错误的 API 操作的数量。

ErrorCount 仅发布在 AWS/Logs 中。

ThrottleCount

因使用量配额而被限制在您账户中执行的 API 操作数量。

ThrottleCount 仅发布在 AWS/Logs 中。

尺寸

维度 描述

Account metrics

使用该维度可获得所有 CloudWatch Logs API 的指标的总和。

如果要查看一个特定 API 的指标,请使用此表中列出的其他维度,并将该 API 名称指定为 Resource 的值。

Service

包含该资源的 AWS 服务的名称。对于 CloudWatch Logs 使用情况指标,此维度的值为 Logs

Class

所跟踪的资源的类。CloudWatch Logs API 使用情况指标使用此维度(值为 None)。

Type

所跟踪的资源的类型。目前,当 Service 维度为 Logs 时,Type 的唯一有效值为 API

Resource

API 操作的名称。有效值包括操作中列出的所有 API 操作名称。例如:PutLogEvents