使用 CloudWatch 指标监控亚马逊托管服务的 Prometheus 资源

适用于 Prometheus 的亚马逊托管服务将使用量指标提供给。 CloudWatch这些指标可让您了解您的工作区利用率。出售的指标可以在中的AWS/Usage和AWS/Prometheus命名空间中找到。 CloudWatch这些指标是免费提供 CloudWatch的。有关使用量指标的更多信息，请参阅CloudWatch 使用量指标。

CloudWatch 指标名称	资源名称	CloudWatch 命名空间	描述
ResourceCount	IngestionRate	`AWS/Usage`	样本摄取率单位：每秒计数有效统计数据：Average、Minimum、Maximum、Sum
ResourceCount	ActiveSeries	`AWS/Usage`	每个工作区的活跃系列数单位：计数有效统计数据：Average、Minimum、Maximum、Sum
ResourceCount	ActiveAlerts	`AWS/Usage`	每个工作区的活动警报数单位：计数有效统计数据：Average、Minimum、Maximum、Sum
ResourceCount	SizeOfAlerts	`AWS/Usage`	工作空间中所有警报的总大小，以字节为单位单位：字节有效统计数据：Average、Minimum、Maximum、Sum
ResourceCount	SuppressedAlerts	`AWS/Usage`	每个工作区处于抑制状态的警报数量。可以通过静默或抑制来抑制警报。单位：计数有效统计数据：Average、Minimum、Maximum、Sum
ResourceCount	UnprocessedAlerts	`AWS/Usage`	每个工作区处于未处理状态的警报数量。警报一经接收，即处于未处理状态 AlertManager，但正在等待下一次聚合组评估。单位：计数有效统计数据：Average、Minimum、Maximum、Sum
ResourceCount	AllAlerts	`AWS/Usage`	每个工作区处于任何状态的警报数量。单位：计数有效统计数据：Average、Minimum、Maximum、Sum
AlertManagerAlertsReceived	-	`AWS/Prometheus`	警报管理器收到的成功警报总数单位：计数有效统计数据：Average、Minimum、Maximum、Sum
AlertManagerNotificationsFailed	-	`AWS/Prometheus`	发送失败的警报数量单位：计数有效统计数据：Average、Minimum、Maximum、Sum
AlertManagerNotificationsThrottled	-	`AWS/Prometheus`	限制的警报数量单位：计数有效统计数据：Average、Minimum、Maximum、Sum
DiscardedSamples^*	-	`AWS/Prometheus`	按原因划分的丢弃样本数量单位：计数有效统计数据：Average、Minimum、Maximum、Sum
RuleEvaluations	-	`AWS/Prometheus`	规则评估总数单位：计数有效统计数据：Average、Minimum、Maximum、Sum
RuleEvaluationFailures	-	`AWS/Prometheus`	间隔内规则评估失败的次数单位：计数有效统计数据：Average、Minimum、Maximum、Sum
RuleGroupIterationsMissed	-	`AWS/Prometheus`	间隔内错过的规则组迭代次数。单位：计数有效统计数据：Average、Minimum、Maximum、Sum

^*导致样本被丢弃的一些原因如下。

Reason	含义
greater_than_max_sample_age	丢弃超过一小时的样本。
new-value-for-timestamp	发送重复样本的时间戳与之前记录的时间戳不同。
per_metric_series_limit	用户已达到每个指标的活跃系列限制。
per_user_series_limit	用户已达到活动系列总数上限。
rate_limited	摄取速率有限。
sample-out-of-order	样品是乱发的，无法处理。
label_value_too_long	标签值超过允许的字符限制。
max_label_names_per_series	用户已点击每个指标的标签名称。
missing_metric_name	未提供指标名称。
metric_name_invalid	提供的指标名称无效。
label_invalid	提供的标签无效。
duplicate_label_names	提供了重复的标签名称。

注意

指标不存在或缺失等同于该指标的值为 0。

注意

RuleGroupIterationsMissed、RuleEvaluations 和 RuleEvaluationFailures 具有以下结构的 RuleGroup 维度：

RuleGroupNamespace;RuleGroup

对 Prometheus 出售的指标设置 CloudWatch 警报

您可以使用警报监控 Prometheus 资源的使用情况。 CloudWatch

在 Prometheus 中为 prometheus ActiveSeries中的数字设置警报

选择 “图表化指标” 选项卡，然后向下滚动到ActiveSeries标签。

在 Graphed 指标视图中，只会显示当前所摄取的指标。
在操作列中选择通知图标。
在指定指标和条件中的条件值字段中输入阈值条件，然后选择下一步。
在配置操作中，选择现有的 SNS 主题或创建一个新 SNS 主题以将通知发送到该 SNS 主题。
在添加名称和描述中，添加警报的名称和可选描述。
选择创建警报。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

监控工作空间

CloudWatch 日志