AWS IoT 指标和维度 - AWS IoT Core

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS IoT 指标和维度

当您与交互时 AWS IoT,该服务会 CloudWatch 每分钟向发送一次指标和维度。您可以使用 AWS IoT、使用 CloudWatch 控制台或 AWS CLI 查看这些指标。

要使用 CloudWatch 控制台查看指标,请打开CloudWatch 控制台。在导航窗格中,选择 Metrics(指标)然后选择 All metrics(所有指标)。在 “浏览” 选项卡中,搜索 AWS IoT 以查看指标列表。指标的分组首先依据服务命名空间,然后依据每个命名空间内的各种维度组合。

要使用查看指标 AWS CLI,请运行以下命令。

aws cloudwatch list-metrics --namespace "AWS/IoT"

AWS IoT 指标

指标 描述

AddThingToDynamicThingGroupsFailed

与将事物添加到动态事物组相关联的失败事件数。DynamicThingGroupName 维度包含添加事物时失败的动态组的名称。

NumLogBatchesFailedToPublishThrottled

因限制错误而无法发布的日志事件的单个批次。

NumLogEventsFailedToPublishThrottled

批处理中的因限制错误而无法发布的日志事件的数量。

AWS IoT Core 凭证提供者指标

指标 描述

CredentialExchangeSuccess

向 AWS IoT Core 凭证提供程序成功提交 AssumeRoleWithCertificate 请求的数量。

身份验证指标

注意

身份验证指标显示在 CloudWatch 控制台的 “协议指标” 下方。

指标 描述

Connection.AuthNError

由于身份验证失败而 AWS IoT Core 被拒绝的连接尝试次数。此指标仅考虑发送与您的端点匹配的服务器名称指示 (SNI) 字符串的连接 AWS 账户。该指标包括来自外部来源(例如互联网扫描工具或探测活动)的连接尝试次数。该Protocol维度包含用于发送连接尝试的协议。

服务器证书OCSP装订指标

指标 描述
R etrieveOCSPStaple Data.Success 已收到并成功处理了OCSP响应。此响应将包含在已配置域的TLS握手期间。该DomainConfigurationName维度包含已启用服务器证书OCSP装订的已配置域的名称。

规则指标

指标 描述

ParseError

在规则正在监听的主题上发布的消息中发生的JSON解析错误数。RuleName 维度包含规则的名称。

RuleMessageThrottled

由于恶意行为或由于消息数超过了规则引擎的限制,规则引擎限制的消息数。RuleName 维度包含要触发的规则的名称。

RuleNotFound

找不到要触发的规则。RuleName 维度包含规则的名称。

RulesExecuted

已执行的 AWS IoT 规则数。

TopicMatch

已在规则所侦听的主题上发布的传入消息的数量。RuleName 维度包含规则的名称。

规则操作指标

指标 描述

Failure

失败的规则操作调用的数量。RuleName 维度包含指定操作的规则的名称。ActionType 维度包含已调用的操作的类型。

Success

成功的规则操作调用的数量。RuleName 维度包含指定操作的规则的名称。ActionType 维度包含已调用的操作的类型。

ErrorActionFailure 失败的错误操作数量。RuleName 维度包含指定操作的规则的名称。ActionType 维度包含已调用的操作的类型。
ErrorActionSuccess 成功的错误操作数量。RuleName 维度包含指定操作的规则的名称。ActionType 维度包含已调用的操作的类型。

HTTP特定于操作的指标

指标 描述

HttpCode_Other

如果来自下游 Web 服务/应用程序的响应的状态代码不是 2xx、4xx 或 5xx,则生成此指标。

HttpCode_4XX

如果来自下游 Web 服务/应用程序的响应的状态代码介于 400 和 499 之间,则生成此指标。

HttpCode_5XX

如果来自下游 Web 服务/应用程序的响应的状态代码介于 500 和 599 之间,则生成此指标。

HttpInvalidUrl

如果替换了替换模板后的端点URL不是以开头的,则生成https://

HttpRequestTimeout

如果下游 Web 服务/应用程序未在请求超时限制内返回响应,则生成此指标。有关更多信息,请参阅 Service Quotas

HttpUnknownHost

如果有效,但服务不存在或无法访问,则生成。URL

消息代理指标

注意

消息代理指标显示在 CloudWatch 控制台的协议指标下。

指标 描述

Connect.AuthError

无法由消息代理授权的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.ClientError

由于MQTT消息不符合中定义的要求而被拒绝的连接请求数AWS IoT 配额Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.ClientIDThrottle

因该客户端超出指定客户端 ID 所允许的连接请求速率而受限的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.ServerError

因出现内部错误而导致失败的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.Success

与消息代理的成功连接的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.Throttle

因账户超出允许的连接请求速率而受限的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Ping.Success

消息代理收到的 ping 消息的数量。Protocol 维度包含用于发送 ping 消息的协议。

PublishIn.AuthError

消息代理无法授权的发布请求的数量。Protocol 维度包含用于发布消息的协议。HTTP发布不支持此指标。

PublishIn.ClientError

因消息未能满足AWS IoT 配额中定义的要求而被消息代理拒绝的发布请求的数量。Protocol 维度包含用于发布消息的协议。HTTP发布不支持此指标。

PublishIn.ServerError

因出现内部错误而导致消息代理无法处理的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。HTTP发布不支持此指标。

PublishIn.Success

消息代理已成功处理的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishIn.Throttle

因客户端超出允许的入站消息速率而受限制的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。HTTP发布不支持此指标。

PublishOut.AuthError

AWS IoT无法授权的由消息代理发出的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishOut.ClientError

因消息未能满足AWS IoT 配额中定义的要求而被拒绝的由消息代理发出的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishOut.Success

消息代理已成功发出的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishOut.Throttle

因客户端超出允许的入站消息速率而节流的发布请求数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishRetained.AuthError

消息代理无法授权的 RETAIN 标签集发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishRetained.ServerError

因出现内部错误而导致消息代理无法处理的保留发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishRetained.Success

消息代理已成功处理的 RETAIN 标签集发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishRetained.Throttle

因客户端超出允许的入站消息速率而受限制的 RETAIN 标签集发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

Queued.Success

消息代理为与持久性会话断开连接的客户端成功处理的存储消息的数量。QoS 为 1 的消息是在具有持久性会话的客户端断开连接时存储的。

Queued.Throttle

在具有持久性会话的客户端断开连接时无法存储和受限制的消息的数量。当客户端超过每个账户每秒的排队消息数限制时,就会发生这种情况。QoS 为 1 的消息是在具有持久性会话的客户端断开连接时存储的。

Queued.ServerError

由于内部错误而未为持久性会话存储的消息数量。当具有持久性会话的客户端断开连接时,将存储服务质量(QoS)为 1 的消息。

Subscribe.AuthError

无法授权的由客户端发出的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Subscribe.ClientError

SUBSCRIBE 消息未能满足 AWS IoT 配额 中定义的要求而被拒绝的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Subscribe.ServerError

因出现内部错误而被拒绝的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Subscribe.Success

消息代理已成功处理的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Subscribe.Throttle

由于超出您的允许的订阅请求速率限制而受到限制的订阅请求数量。 AWS 账户这些限制包括AWS IoT Core 消息代理和协议限制和配额中描述的每个账户的每秒订阅数、每个账户的订阅量以及每个连接的订阅量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Throttle.Exceeded 该指标将在每个连接级别限制的每秒数据包数限制中 CloudWatch 显示在MQTT客户端上。此指标不适用于HTTP连接。

Unsubscribe.ClientError

UNSUBSCRIBE 消息未能满足 AWS IoT 配额 中定义的要求而被拒绝的取消订阅请求的数量。Protocol 维度包含用于发送 UNSUBSCRIBE 消息的协议。

Unsubscribe.ServerError

因出现内部错误而被拒绝的取消订阅请求的数量。Protocol 维度包含用于发送 UNSUBSCRIBE 消息的协议。

Unsubscribe.Success

消息代理已成功处理的取消订阅请求的数量。Protocol 维度包含用于发送 UNSUBSCRIBE 消息的协议。

Unsubscribe.Throttle

因客户端超出允许的取消订阅请求速率而被拒绝的取消订阅请求的数量。Protocol 维度包含用于发送 UNSUBSCRIBE 消息的协议。

设备影子指标

注意

设备影子指标显示在 CloudWatch 控制台的 “协议指标” 下方。

指标 描述

DeleteThingShadow.Accepted

已成功处理的 DeleteThingShadow 请求的数量。Protocol 维度包含用于发出请求的协议。

GetThingShadow.Accepted

已成功处理的 GetThingShadow 请求的数量。Protocol 维度包含用于发出请求的协议。

ListThingShadow.Accepted

已成功处理的 ListThingShadow 请求的数量。Protocol 维度包含用于发出请求的协议。

UpdateThingShadow.Accepted

已成功处理的 UpdateThingShadow 请求的数量。Protocol 维度包含用于发出请求的协议。

任务指标

指标 描述

CanceledJobExecutionCount

在由确定的时间段CANCELED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

CanceledJobExecutionTotalCount

给定任务的状态为 CANCELED 的任务执行总数。JobId 维度包含任务的 ID。

ClientErrorCount

执行任务时生成的客户端错误数。JobId 维度包含任务的 ID。

FailedJobExecutionCount

在由确定的时间段FAILED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

FailedJobExecutionTotalCount

给定任务的状态为 FAILED 的任务执行总数。JobId 维度包含任务的 ID。

InProgressJobExecutionCount

在由确定的时间段IN_PROGRESS内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

InProgressJobExecutionTotalCount

给定任务的状态为 IN_PROGRESS 的任务执行总数。JobId 维度包含任务的 ID。

RejectedJobExecutionTotalCount

给定任务的状态为 REJECTED 的任务执行总数。JobId 维度包含任务的 ID。

RemovedJobExecutionTotalCount

给定任务的状态为 REMOVED 的任务执行总数。JobId 维度包含任务的 ID。

QueuedJobExecutionCount

在由确定的时间段QUEUED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

QueuedJobExecutionTotalCount

给定任务的状态为 QUEUED 的任务执行总数。JobId 维度包含任务的 ID。

RejectedJobExecutionCount

在由确定的时间段REJECTED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

RemovedJobExecutionCount

在由确定的时间段REMOVED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

ServerErrorCount

执行任务时生成的服务器错误数。JobId 维度包含任务的 ID。

SuccededJobExecutionCount

在由确定的时间段SUCCESS内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

SuccededJobExecutionTotalCount

给定任务的状态为 SUCCESS 的任务执行总数。JobId 维度包含任务的 ID。

Device Defender audit 指标

指标 描述

NonCompliantResources

在检查中发现的不合规资源数。系统报告执行的每次审核中,对于每次检查发现的不合规资源数。

ResourcesEvaluated

执行合规性评估的资源数。系统报告执行的每次审核中,对于每次检查所评估的资源数。

MisconfiguredDeviceDefenderNotification

当您的SNS配置配置错误时会通知您。 AWS IoT Device Defender

尺寸

Device Defender detect 指标

指标 描述

NumOfMetricsExported

云端、设备端或自定义指标导出的指标数量。系统会报告该账户就某项特定指标导出的指标数量。此指标仅对使用指标导出功能的客户提供。

NumOfMetricsSkipped

云端、设备端或自定义指标跳过的指标数量。由于为发布到 mqtt 主题而向 Device Defender Detect 提供的权限不足,系统会报告该账户就某项特定指标跳过的指标数量。此指标仅对使用指标导出功能的客户提供。

NumOfMetricsExceedingSizeLimit

由于大小超过MQTT邮件大小限制而跳过导出的云端、设备端或自定义指标的指标数量。系统会报告该账户因大小超过MQTT邮件大小限制而跳过导出的指标数量。此指标仅对使用指标导出功能的客户提供。

Violations

自上次执行评估以来,所发现的安全配置文件行为的新违规数。系统针对特定安全配置文件,以及针对某个特定安全配置文件的特定行为,报告账户的新违规数。

ViolationsCleared

自上次执行评估以来,已解决的安全配置文件行为的违规数。系统针对特定安全配置文件,以及针对某个特定安全配置文件的特定行为,报告账户的已解决违规数。

ViolationsInvalidated

自上次执行评估以来,其信息不再可用(由于报告设备已停止报告,或者由于某个原因不再监控)的安全配置文件行为的违规数。系统针对特定安全配置文件,以及针对某个特定安全配置文件的特定行为,报告整个账户的已失效违规数。

MisconfiguredDeviceDefenderNotification

当您的SNS配置配置错误时会通知您。 AWS IoT Device Defender

尺寸

设备预配置指标

AWS IoT 舰队配置指标
指标 描述

ApproximateNumberOfThingsRegistered

Fleet Provisioning 注册的事物的计数。

虽然计数通常是准确的,但 AWS IoT Core 的分布式架构使得很难让已注册事物保持精确计数。

此指标将使用的统计数据是:

  • Max(最大值),用以报告已注册事物的总数。有关在 CloudWatch聚合窗口期间注册的事物的计数,请参阅RegisterThingFailed指标。

尺寸:ClaimCertificateId

CreateKeysAndCertificateFailed

调用时发生的失败次数CreateKeysAndCertificateMQTTAPI。

在“成功”(值 = 0)和“故障”(值 = 1)情况下均发出该指标。此指标可用于跟踪在 CloudWatch支持的聚合时段(例如 5 分钟或 1 小时)内创建和注册的证书数量。

此指标的可用统计数据包括:

  • Sum(总计),用以报告失败的调用数。

  • SampleCount报告成功和失败的呼叫总数。

CreateCertificateFromCsrFailed

调用时发生的失败次数CreateCertificateFromCsrMQTTAPI。

在“成功”(值 = 0)和“故障”(值 = 1)情况下均发出该指标。此指标可用于跟踪在 CloudWatch支持的聚合时段(例如 5 分钟或 1 小时)内注册的事物的数量。

此指标的可用统计数据包括:

  • Sum(总计),用以报告失败的调用数。

  • SampleCount报告成功和失败的呼叫总数。

RegisterThingFailed

调用时发生的失败次数RegisterThingMQTTAPI。

在“成功”(值 = 0)和“故障”(值 = 1)情况下均发出该指标。此指标可用于跟踪在 CloudWatch支持的聚合时段(例如 5 分钟或 1 小时)内注册的事物的数量。有关注册的事物总数,请参阅 ApproximateNumberOfThingsRegistered 指标。

此指标的可用统计数据包括:

  • Sum(总计),用以报告失败的调用数。

  • SampleCount报告成功和失败的呼叫总数。

尺寸:TemplateName

Just-in-time 配置指标
指标 描述

ProvisionThing.ClientError

由于客户端错误无法预置设备的次数。例如,模板中指定的策略不存在。

ProvisionThing.ServerError

由于服务器错误而无法预置设备的次数。客户可以在等待后重新尝试预置设备,如果问题仍然存在,则可以尝试联系 AWS IoT 。

ProvisionThing.Success

成功预置设备的次数。

LoRaWAN指标

下表显示了 AWS IoT Core 的指标 LoRaWAN。有关更多信息,AWS IoT Core 请参阅,了解 LoRaWAN指标

AWS IoT Core 用于 LoRaWAN指标
指标 描述

活动设备/网关

您账户中活跃 LoRaWAN设备和网关的数量。

上行链路消息数

在指定时间段内为您的 AWS 账户所有活动网关和设备发送的上行链路消息的数量。上行链路消息是从您的设备发送到 AWS IoT Core 的 LoRaWAN消息。

下行链路消息数

在指定时间段内为您的 AWS 账户所有活动网关和设备发送的下行链路消息的数量。下行链路消息是从 for 发送 LoRaWAN到 AWS IoT Core 您的设备的消息。

消息丢失率

在您添加设备并连接到 for AWS IoT Core 之后 LoRaWAN,您的设备可以启动一条上行链路消息,开始与云端交换消息。然后,您可以使用此指标来跟踪上行链路消息的丢失率。

加入指标

添加设备和网关后,您需要执行加入程序,以便您的设备可以发送上行链路数据并与 AWS IoT Core 之通信。 LoRa WAN您可以使用此指标来获取有关您中所有活跃设备的加入指标的信息 AWS 账户。

平均接收信号强度指示器 (RSSI)

您可以使用此指标来监控指定时间段内的平均值RSSI(接收到的信号强度指示器)。RSSI是一种衡量标准,用于指示信号是否足够强以实现良好的无线连接。此值为负值,必须接近零才能实现牢固连接。

平均信噪比 (SNR)

您可以使用此指标来监控指定时间段内的平均值SNR(Signal-to-noise 比率)。SNR是一种衡量标准,用于指示接收的信号与噪声水平相比是否足够强,从而实现良好的无线连接。该SNR值为正且必须大于零才能表示信号功率大于噪声功率。

网关可用性

您可以使用此指标来获取有关该网关在指定时间段内的可用性的信息。此指标显示该网关在指定时间段内的 websocket 连接时间。

Just-in-time 配置指标
指标 描述

ProvisionThing.ClientError

由于客户端错误无法预置设备的次数。例如,模板中指定的策略不存在。

ProvisionThing.ServerError

由于服务器错误而无法预置设备的次数。客户可以在等待后重新尝试预置设备,如果问题仍然存在,则可以尝试联系 AWS IoT 。

ProvisionThing.Success

成功预置设备的次数。

机群索引指标

AWS IoT 舰队索引指标
指标 描述

NamedShadowCountForDynamicGroupQueryLimitExceeded

对于不是动态事物组中特定于数据来源的查询术语,每件事物最多处理 25 个命名影子。由于事件而违反该限制时,将发出 NamedShadowCountForDynamicGroupQueryLimitExceeded 事件类型。

指标的维度

指标使用命名空间并为以下维度提供指标
维度 描述
ActionType

触发请求的规则所指定的操作类型

BehaviorName

正受监控的 Device Defender Detect 安全配置文件行为的名称。

ClaimCertificateId

用于预置设备的申请的 certificateId

CheckName

正在监控其结果的 Device Defender Audit 检查的名称。

JobId

正在监控其进度或消息连接成功/失败的任务的 ID。

Protocol

用于提出请求的协议。有效值为:MQTT或 HTTP

RuleName

由请求触发的规则的名称。

ScheduledAuditName

正在监控其检查结果的 Device Defender 计划审核的名称。如果报告的结果适用于按需执行的审计,此项具有值 OnDemand

SecurityProfileName

正在监控其行为的 Device Defender Detect 安全配置文件的名称。

TemplateName

预配置模板的名称。

SourceArn 指用于检测的安全配置文件或用于审计的账户 arn。

RoleArn

指设备防御者试图扮演的角色。

TopicArn

请参阅 Device Defender 尝试发布SNS的主题。

Error

简要描述在尝试向该SNS主题发布内容时收到的错误。可能的值有:
  • “KMSKeyNotFound“: 表示该主题的KMS密钥不存在。

  • “InvalidTopicName“: 表示SNS主题无效。

  • “KMSAccessDenied“: 表示该角色无权访问该主题的KMS密钥。

  • “AuthorizationError“: 表示所提供的角色未授权设备防御者向该SNS主题发布内容。

  • “SNSTopicNotFound“: 表示提供的SNS主题不存在。

  • “FailureToAssumeRole“: 表示所提供的角色未授权设备防御者担任该角色。

  • “CrossRegionSNSTopic“: 表示该SNS主题存在于不同的区域。