建立規則檔案 - Amazon Managed Service for Prometheus

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立規則檔案

若要在 Amazon Managed Service for Prometheus 中使用規則,您會建立定義規則的規則檔案。Amazon Managed Service for Prometheus 規則檔案是YAML文字檔案,其格式與獨立 Prometheus 中的規則檔案相同。如需詳細資訊,請參閱 Prometheus 文件中的定義錄製規則警示規則

以下是規則檔案的基本範例:

groups: - name: cpu_metrics rules: - record: avg_cpu_usage expr: avg(rate(node_cpu_seconds_total[5m])) by (instance) - alert: HighAverageCPU expr: avg_cpu_usage > 0.8 for: 10m keep_firing_for: 20m labels: severity: critical annotations: summary: "Average CPU usage across cluster is too high"

這個簡單的範例會使用名為 的錄製規則建立新的指標,avg_cpu_usage然後在提醒中使用。以下說明使用的一些屬性。如需有關提醒規則和您可以包含的其他屬性的詳細資訊,請參閱 Prometheus 文件中的提醒規則

  • record: avg_cpu_usage – 此錄製規則會建立新的指標,稱為 avg_cpu_usage

  • expr: avg(rate(node_cpu_seconds_total[5m])) by (instance) – 錄製規則的此表達式會計算每個節點過去 5 分鐘的平均CPU使用率,並依instance標籤分組。

  • alert: HighAverageCPU – 此提醒規則會建立新的提醒,稱為 HighAverageCPU

  • expr: avg_cpu_usage > 0.8 – 此表達式會通知 ,以尋找平均CPU用量超過 80% 的範例。

  • for: 10m – 當表達式滿足 10 分鐘時,提醒將會觸發。在這種情況下,樣本是平均 5 分鐘,因此當收到至少 2 個超過閾值的樣本時,警示將會觸發。

  • keep_firing_for: 20m – 此提醒會持續觸發,直到樣本低於閾值至少 20 分鐘為止。這有助於避免警示連續不斷地上下移動。

如需更多警示規則範例,請參閱警示規則範例

注意

您可以在本機建立規則定義檔案,然後將其上傳至 Amazon Managed Service for Prometheus,也可以直接在 Amazon Managed Service for Prometheus 主控台中建立、編輯和上傳定義。無論哪種方式,都適用相同的格式化規則。若要進一步了解如何上傳和編輯檔案,請參閱 將規則組態檔案上傳至 Amazon Managed Service for Prometheus