规则器故障排除 - Amazon Managed Service for Prometheus

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

规则器故障排除

使用 使用日志监控亚马逊托管服务 Prometheus 事件 CloudWatch ,您可以对警报管理器和规则器相关问题进行故障排除。本部分包含与规则器相关的故障排除主题。

当日志包含以下规则器失败错误时

{ "workspaceId": "ws-12345c67-89c0-4d12-345b-f14db70f7a99", "message": { "log": "Evaluating rule failed, name=failure, group=canary_long_running_vl_namespace, namespace=canary_long_running_vl_namespace, err=found duplicate series for the match group {dimension1=\\\"1\\\"} on the right hand-side of the operation: [{__name__=\\\"fake_metric2\\\", dimension1=\\\"1\\\", dimension2=\\\"b\\\"}, {__name__=\\\"fake_metric2\\\", dimension1=\\\"1\\\", dimension2=\\\"a\\\"}];many-to-many matching not allowed: matching labels must be unique on one side", "level": "ERROR", "name": "failure", "group": "canary_long_running_vl_namespace", "namespace": "canary_long_running_vl_namespace" }, "component": "ruler" }

这意味着在执行规则时出现了一些错误。

要采取的操作

使用错误消息对规则执行进行故障排除。