通知ポリシーの使用 - Amazon Managed Grafana

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

通知ポリシーの使用

このドキュメントのトピックは、Grafana バージョン 8.x をサポートする Grafana ワークスペース向けです。

Grafana バージョン 10.x をサポートする Grafana ワークスペースについては、「Grafana バージョン 10 での作業」を参照してください。

Grafana バージョン 9.x をサポートする Grafana ワークスペースについては、「Grafana バージョン 9 での作業」を参照してください。

通知ポリシーでは、アラートがコンタクトポイント (通知先) にどのように配信されるかを指定します。ポリシーはツリー構造で、ポリシーごとに 1 つ以上の子ポリシーを持つことができます。ルートポリシーを除く各ポリシーは、特定のアラートラベルにも一致させることができます。各アラートはルートポリシーによって評価され、次に各子ポリシーによって評価されます。特定のポリシーに対して Continue matching subsequent sibling nodes オプションを有効にすると、1 つ以上の一致があっても評価が続行されます。子ポリシーのいずれとも一致しない場合、親ポリシーの設定とコンタクトポイント (通知先) の情報によってアラートの動作が制御されます。特定のポリシーと一致しない場合、ルートポリシーがアラートを制御します。

注記

Grafana 管理のアラートの通知ポリシーを作成および編集することができますが、アラートマネージャーアラートの通知ポリシーは読み取り専用となっています。

通知のグループ化

グループ化すると、似た性質のアラート通知を 1 つの funnel にまとめられます。これは、システム上で一度に複数の障害が発生して多数のアラートが同時に発生する場合、大規模な停止中にアラート通知を制御することができます。

グループ化の例

例えば、異なる環境でデータベースに接続されている100のサービスがあるとします。これらのサービスは、ラベル env=environmentname で区別され、サービスがデータベースに到達できるかどうかを監視するためのアラートルールが設定されています。このアラートルールは、alertname=DatabaseUnreachable という名前のアラートを作成します。

サービスの半分がデータベースに到達できなくなったネットワークの分断が発生すると、50 件のアラートが個別に発生しますが、影響を受けている環境のリストを含む (50 件ではなく) 1 ページの通知を受け取りたいと考えています。

group_by: [alertname]でグループ化を設定することができます(サービスごとに異なるenv ラベルを使用する代わりに)。この設定を行うと、Grafana は、このアラートルールの影響を受けるすべての環境が記載された 1 通のコンパクトな通知を送信します。

[特殊グループ]

Grafana には 2 つの特殊グループがあります。デフォルトのグループである group_by: null は、すべてのアラートを 1 つのグループにグループ化します。... という名前の特殊ラベルを使用してすべてのラベルでアラートをグループ化することで、グループ化を無効にし、各アラートを独自のグループに送信することもできます。

通知の使用

以下に、通知ポリシーを作成および管理するための手順を紹介します。

ルート通知ポリシーの編集方法
  1. Grafana コンソールの Grafana メニューで、[アラート] (ベル) アイコンを選択して [アラート] ページを開きます。

  2. [通知ポリシー] を選択します。

  3. [アラートマネージャー] ドロップダウンから、編集するアラートマネージャーを選択します。

  4. [ルートポリシー] セクションで、[編集] アイコン (ペン) を選択します。

  5. [デフォルトのコンタクトポイント] で、アラートルールが特定のポリシーと一致しない場合に通知を送信するコンタクトポイント (通知先) を更新します。

  6. [グループ化対象] で、アラートをグループ化するラベル (または特殊グループ) を選択します。

  7. [タイミングオプション] で、以下のいずれかを選択します。

    • [グループ待機] – 同じグループのアラートをバッファリングしてから、最初の通知を送信するまでの待機時間。デフォルト値は 30 秒です。

    • [グループ間隔] – グループ内の 2 つの通知の最小時間間隔。デフォルトは 5 分です。

    • [繰り返し間隔] – グループに新しいアラートが追加されなかった場合に、通知を再送信するまでの最小時間間隔。デフォルトは 4 時間です。

  8. [保存] を選択して変更を保存します。

上位の特定のポリシーの追加方法
  1. Grafana コンソールの Grafana メニューで、[アラート] (ベル) アイコンを選択して [アラート] ページを開きます。

  2. [通知ポリシー] を選択します。

  3. [アラートマネージャー] ドロップダウンから、編集するアラートマネージャーを選択します。

  4. [特定のルーティング] セクションで、[新しい特定のポリシー] を選択します。

  5. [一致するラベル] セクションで、一致するアラートラベルを 1 つ以上追加します。ラベルの一致の詳細については、このトピックの後半で説明します。

  6. コンタクトポイントで、アラートがこの特定のポリシーと一致する場合に通知を送信するコンタクトポイントを追加します。ネストされたポリシーは、このコンタクトポイントを上書きします。

  7. 必要に応じて [グループ化を上書き] を選択して、ルートポリシーとは異なるグループ化を指定します。

  8. 必要に応じて [一般的なタイミングを上書き] を選択して、グループ通知ポリシーで設定されているタイミングオプションを上書きします。

  9. [Save policy(ポリシーの保存] を選択して変更を保存します。

ネストしたポリシーの追加方法
  1. ネストしたポリシーの作成先となる特定のポリシーを展開します。

  2. [ネストしたポリシーの追加] を選択し、詳細を追加します (最上位の特定のポリシーを追加する場合と同様)。

  3. [Save policy(ポリシーの保存] を選択して変更を保存します。

特定のポリシーの編集方法
  1. [アラート] ページから [通知ポリシー] を選択するとページを開き、現在設定されているポリシーが一覧表示されます。

  2. 編集する設定ポリシーを選択したら、[編集] アイコン (ペン) を選択します。

  3. 必要な変更を加えます (最上位の特定のポリシーを追加する場合と同様)。

  4. [ポリシーを保存]を選択します。

ラベル一致の仕組み

ポリシーは、アラートのラベルがポリシーで指定されたすべての一致ラベルと合致する場合に、そのアラートに適用されます。

  • ラベル – 一致させるラベルの名前。アラートのラベル名と完全に一致する必要があります。

  • [演算子] – ラベル値と一致するラベル値の比較に使用される演算子。利用できる演算子は次のとおりです。

    • = 値が指定された文字列と完全に一致するラベルが選択されます。

    • != 値が指定された文字列と一致しないラベルが選択されます。

    • =~ 指定された文字列の正規表現解釈値と一致するラベルが選択されます (指定された文字列は正規表現として解釈されます)

    • != 指定された正規表現と一致しないラベルが選択されます。

  • Value (値) – ラベル値と一致する値。選択した演算子に応じて、文字列または正規表現として照合させることができます。

ミュートタイミング

ミュートタイミングとは、ポリシーの新しい通知が生成されたり送信されないようにする繰り返しの時間間隔です。定期的なメンテナンス期間など、アラートが特定の期間や繰り返し発生するのを防ぐために使用されます。

サイレンスと似ていますが、ミュートタイミングはアラートルールの評価や、ユーザーインターフェースへのアラート表示を停止せず、通知の作成のみを防ぎます。

外部のアラートマネージャーデータソースの Grafana 管理のミュートタイミングとミュートタイミングを設定できます。

サイレンスとミュートタイミングの比較

次の表に、「ミュートタイミング」と「サイレンス」の違いを示します。

ミュートタイミング サイレンス

繰り返しの時間間隔を定義します

開始時刻と終了時刻を固定します

作成され、通知ポリシーに追加されます

ラベルを使用してアラートと照合し、サイレンスするかどうかが判断されます

ミュートタイミングの作成方法
  1. Grafana コンソールの Grafana メニューで、[アラート] (ベル) アイコンを選択して [アラート] ページを開きます。

  2. [通知ポリシー] を選択します。

  3. [アラートマネージャー] ドロップダウンから、編集するアラートマネージャーを選択します。

  4. [ミュートタイミング] セクションで、[ミュートタイミングの追加] ボタンを選択します。

  5. ミュートタイミングを適用したい時間間隔を選択します。

  6. [送信] を選択してミュートタイミングを作成します。

通知ポリシーへのミュートタイミングの追加方法
  1. ミュートタイミングを追加する通知ポリシーを選択し、[編集] ボタンを選択します。

  2. [ミュートタイミング] ドロップダウンから、ポリシーに追加するミュートタイミングを選択します。

    [ポリシーを保存] ボタンを選択します。

時間間隔

時間間隔には、時間範囲を指定します。この時間間隔内にアラートが発生した場合、抑制されます。範囲には : を使用して表現することができます (例: monday:thursday)。ミュートタイミングには複数の時間間隔を含めることができます。時間間隔は複数のフィールド (詳細は次のリストを参照) で構成され、アラートを抑制するには、すべてのフィールドが一致する必要があります。例えば、曜日に月曜日から金曜日 monday:friday、時間範囲を 8:00~9:00 と指定した場合、アラートは月曜日から金曜日の 8:00~9:00 の間は抑制されますが、土曜日の 8:00~9:00 は抑制されません。

  • [時間範囲] – 通知を抑制する時間帯。[開始時刻][終了時刻] の 2 つのサブフィールドで構成されます。時刻は 14:30 のように指定します。時刻は UTC の 24 時間表記です。

  • [曜日] - 曜日。単一の日 (例: monday)、範囲 (例: monday:friday)、またはカンマで区切られた複数の日のリスト (例: monday, tuesday, wednesday) を指定できます。

  • [月] - 選択する月。月は、数値で指定することも、完全な月名で指定することもできます。例えば、1 または january のどちらでも 1 月を指定できます。単一の月、月の範囲、またはカンマ区切りの月のリストを指定できます。

  • [月の日付] – 1 か月内の日付。値は 131 の範囲で指定します。負の値は月の日を逆順で指定することを意味します。たとえば、-1 は月の最終日を表します。日付は単一の日、日付の範囲、またはカンマで区切った日付のリストを指定できます。