本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
建立規則檔案
若要在 Amazon Managed Service for Prometheus 中使用規則,您會建立定義規則的規則檔案。Amazon Managed Service for Prometheus 規則檔案是YAML文字檔案,其格式與獨立 Prometheus 中的規則檔案相同。如需詳細資訊,請參閱 Prometheus 文件中的定義錄製規則
以下是規則檔案的基本範例:
groups: - name: cpu_metrics rules: - record: avg_cpu_usage expr: avg(rate(node_cpu_seconds_total[5m])) by (instance) - alert: HighAverageCPU expr: avg_cpu_usage > 0.8 for: 10m keep_firing_for: 20m labels: severity: critical annotations: summary: "Average CPU usage across cluster is too high"
這個簡單的範例會使用名為 的錄製規則建立新的指標,avg_cpu_usage
然後在提醒中使用。以下說明使用的一些屬性。如需有關提醒規則和您可以包含的其他屬性的詳細資訊,請參閱 Prometheus 文件中的提醒規則
-
record: avg_cpu_usage
– 此錄製規則會建立新的指標,稱為avg_cpu_usage
。 -
expr: avg(rate(node_cpu_seconds_total[5m])) by (instance)
– 錄製規則的此表達式會計算每個節點過去 5 分鐘的平均CPU使用率,並依instance
標籤分組。 -
alert: HighAverageCPU
– 此提醒規則會建立新的提醒,稱為HighAverageCPU
-
expr: avg_cpu_usage > 0.8
– 此表達式會通知 ,以尋找平均CPU用量超過 80% 的範例。 -
for: 10m
– 當表達式滿足 10 分鐘時,提醒將會觸發。在這種情況下,樣本是平均 5 分鐘,因此當收到至少 2 個超過閾值的樣本時,警示將會觸發。 -
keep_firing_for: 20m
– 此提醒會持續觸發,直到樣本低於閾值至少 20 分鐘為止。這有助於避免警示連續不斷地上下移動。
如需更多警示規則範例,請參閱警示規則範例
注意
您可以在本機建立規則定義檔案,然後將其上傳至 Amazon Managed Service for Prometheus,也可以直接在 Amazon Managed Service for Prometheus 主控台中建立、編輯和上傳定義。無論哪種方式,都適用相同的格式化規則。若要進一步了解如何上傳和編輯檔案,請參閱 將規則組態檔案上傳至 Amazon Managed Service for Prometheus。