Grafana マネージドアラートルールを設定する - Amazon Managed Grafana

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Grafana マネージドアラートルールを設定する

このドキュメントトピックは、Grafana バージョン 10.x をサポートする Grafana ワークスペース向けに設計されています。

Grafana バージョン 9.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 9 での作業

Grafana バージョン 8.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 8 での作業

Grafana マネージドルールは、最も柔軟なアラートルールタイプです。これにより、サポートされているデータソースからのデータに作用できるアラートを作成できます。複数のデータソースをサポートするだけでなく、式を追加してデータを変換し、アラート条件を設定することもできます。アラート通知でのイメージの使用もサポートされています。これは、単一のルール定義で複数のデータソースからのアラートを許可する唯一のタイプのルールです。

1 つのアラートルール (多次元アラートとも呼ばれます) の結果として、複数のアラートインスタンスを作成できます。

Grafana マネージドアラートルールは、ルールを保存するフォルダの編集権限を持つユーザーのみが編集または削除できます。

UI で作成されたアラートリソースを削除すると、そのリソースを取得できなくなります。設定をバックアップし、削除されたアラートリソースを復元できるようにするには、Terraform またはアラート を使用してアラートリソースを作成しますAPI。

以下の手順では、Grafana が管理するアラートルールを作成するプロセスについて説明します。

Grafana が管理するアラートルールを作成するには、ワークスペース内のアラート作成フローを使用し、以下の手順に従ってサポートします。

アラートルール名を設定する
  1. アラート -> アラートルール -> + 新しいアラートルール を選択します。

  2. アラートルールを識別する名前を入力します。

    この名前はアラートルールリストに表示されます。また、このルールから作成されるすべてのアラートインスタンスのalertnameラベルでもあります。

次に、測定するデータを取得するクエリと、アラートルールが発生する前に満たす必要がある条件を定義します。

クエリと条件を定義するには
  1. データソースを選択します。

  2. オプションドロップダウンから、時間範囲 を指定します。

    注記

    Grafana アラートは、 などの固定相対時間範囲のみをサポートしますnow-24hr: now

    絶対時間範囲 2021-12-02 00:00:00 to 2021-12-05 23:59:592または半相対時間範囲 はサポートされていませんnow/d to: now

  3. クエリを追加します。

    複数のクエリを追加するには、クエリの追加 を選択します。

    すべてのアラートルールは、デフォルトで Grafana によって管理されます。データソース管理のアラートルールに切り替える場合は、データソース管理のアラートルールに切り替える をクリックします。

  4. 1 つ以上の式 を追加します。

    1. 式ごとに Classic 条件を選択して単一のアラートルールを作成するか、Math Reduce Resample オプションから選択して、各シリーズに個別のアラートを生成します。

      注記

      Prometheus を使用する場合、インスタントベクトル関数と組み込み関数を使用できます。そのため、式を追加する必要はありません。

    2. プレビューを選択して、式が成功したことを確認します。

  5. 〔オプション] 復旧しきい値を追加するには、カスタム復旧しきい値のトグルをオンにして、アラートルールが発火を停止する の値を入力します。

    クエリに追加できる復旧しきい値は 1 つだけで、アラート条件である必要があります。

  6. アラート条件として設定するクエリまたは式で、アラート条件として設定を選択します。

アラートルールの評価を使用して、アラートルールを評価する頻度と、その状態をどの程度迅速に変更するかを判断します。

これを行うには、アラートルールが正しい評価グループにあることを確認し、ユースケースに最適な保留期間を設定する必要があります。

アラート評価の動作を設定するには
  1. フォルダを選択するか、+ 新しいフォルダ を選択します。

  2. 評価グループを選択するか、 + 新しい評価グループ をクリックします。

    新しい評価グループを作成する場合は、グループの間隔を指定します。

    同じグループ内のすべてのルールは、同じ時間間隔で同時に評価されます。

  3. 保留中の期間を入力します。

    保留期間は、アラートルールが発動するまで条件に違反している可能性がある期間です。

    条件が満たされると、アラートは保留状態になります。指定された期間、条件がアクティブなままの場合、アラートは発射状態に移行し、アクティブでない場合は通常の状態に戻ります。

  4. 必要に応じて、アラート通知の一時停止を有効にします。

    注記

    アラートルールの評価を一時停止して、アラートの調整中にノイズの多いアラートが発生しないようにします。一時停止すると、アラートルールの評価が停止し、アラートインスタンスは作成されません。これは、通知の配信を停止するミュートタイミングとは異なりますが、アラートルールの評価とアラートインスタンスの作成は可能です。

    アラートルールの評価を一時停止して、アラートの調整中にノイズの多いアラートを防ぐことができます。一時停止すると、アラートルールの評価が停止し、アラートインスタンスは作成されません。これは、通知の配信を停止するミュートタイミングとは異なりますが、アラートルールの評価とアラートインスタンスの作成は可能です。

  5. データなしの設定 とエラー処理 で、データがない場合のアラート動作を設定します。

    このセクションの後半でガイドラインを使用します。

アラートルールにラベルを追加して、発射アラートインスタンスを処理する通知ポリシーを設定します。

すべてのアラートルールとインスタンスは、ラベルに関係なく、デフォルトの通知ポリシーと一致します。ネストされたポリシーがない場合、またはネストされたポリシーがアラートルールまたはアラートインスタンスのラベルと一致しない場合、デフォルトの通知ポリシーは一致するポリシーです。

通知を設定するには
  1. 通知のルーティング方法を変更する場合は、ラベルを追加します。

    ドロップダウンから既存のキーと値のペアを選択してカスタムラベルを追加するか、新しいキーまたは値を入力して新しいラベルを追加します。

  2. アラートインスタンスのルーティング設定をプレビューします。

    追加したラベルに基づいて、アラートインスタンスは表示される通知ポリシーにルーティングされます。

    各通知ポリシーを展開して、詳細を表示します。

  3. 詳細を表示を選択して、アラートルーティングの詳細とプレビューを表示します。

アラート通知メッセージでアラートに関するコンテキストをより詳細に提供する注釈を追加します。

注釈は、アラート通知メッセージでアラートに関する詳細情報を提供するメタデータを追加します。例えば、概要注釈を追加して、アラートが起動した値や発生したサーバーを示します。

注釈を追加するには
  1. 〔オプション] 概要を追加します。

    何が起こったのか、その理由の簡単な概要。

  2. 〔オプション] 説明を追加します。

    アラートルールの動作の説明。

  3. 〔オプション] Runbook を追加しますURL。

    アラートのランブックを保持するウェブページ

  4. 〔オプション] カスタム注釈を追加する

  5. 〔オプション] ダッシュボードとパネルリンクを追加します。

    アラートをダッシュボードのパネルにリンクします。

  6. [Save rule] (ルールを保存) を選択します。

単一および多次元ルール

Grafana マネージドアラートでは、従来の条件を使用してルールを作成することも、多次元ルールを作成することもできます。

  • クラシック条件のルール

    クラシック条件式を使用して、条件が満たされたときに単一のアラートをトリガーするルールを作成します。複数のシリーズを返すクエリの場合、Grafana は各シリーズのアラート状態を追跡しません。その結果、複数のシリーズでアラート条件が満たされた場合でも、Grafana は 1 つのアラートのみを送信します。

  • 多次元ルール

    シリーズごとに個別のアラートを生成するには、多次元ルールを作成します。MathReduce、または Resample式を使用して、多次元ルールを作成します。例:

    • 各クエリのReduce式を追加して、選択した時間範囲の値を 1 つの値に集計します (数値データ を使用するルールには必要ありません)。

    • ルールの条件を持つMath式を追加します。クエリや reduce 式がルールが発せられない0場合はすでに返され、発せない場合は正の数値が返される場合には必要ありません。いくつかの例: B $B > 70 クエリ/式の値 が 70 を超える場合に発生する場合。B $B < $C * 100 の値が C の値に 100 を掛けた場合に発生する場合。比較されるクエリの結果に複数のシリーズがある場合、異なるクエリのシリーズが同じラベルを持っているか、一方が他方のサブセットである場合、それらは一致します。

注記

Grafana は、テンプレート変数を使用したアラートクエリをサポートしていません。詳細については、https://community.grafana.com/t/template-variables-are-not-supported-in-alert-queries-while-setting-up-alert/2514 を参照してください。

データおよびエラー処理を設定しない

アラートルール評価がデータまたはエラーを返さない場合のアラート動作を設定します。

注記

評価がデータが返されない場合、または評価期間全体が終了した場合にのみエラーが発生する場合に発するように設定されたアラートルール。つまり、アラートルール条件に違反したときにすぐに発射するのではなく、アラートルールは For フィールドとして設定された時間が終了するまで待機してから発射し、アラートノイズを減らし、一時的なデータ可用性の問題を可能にします。

アラートルールの評価でデータが返されない場合は、次のようにアラートルールの状態を設定できます。

データなし 説明
データなし アラートルールの名前と、ラベルとしてデータを返さなかったUIDデータソースUIDの名前と名前DatasourceNoDataで新しいアラートを作成します。
アラート アラートルールの状態を に設定しますAlerting。アラートルールは、For フィールドで設定された時間が終わるまで待機してから発射します。
OK アラートルールの状態を に設定しますNormal

評価でエラーが返された場合は、アラートルールの状態を次のように設定できます。

エラー 説明
エラー アラートルールの名前と、ラベルとしてデータを返さなかったUIDデータソースUIDの名前と名前DatasourceErrorを持つアラートインスタンスを作成します。
アラート アラートルールの状態を に設定しますAlerting。アラートルールは、For フィールドで設定された時間が終わるまで待機してから発射します。
OK アラートルールの状態を に設定しますNormal

古いアラートインスタンスを解決する

アラートインスタンスのディメンションまたはシリーズが 2 つの評価間隔でクエリ結果から完全に消えた場合、アラートインスタンスは古いと見なされます。

Alerting/NoData/Error 状態にある古いアラートインスタンスは、自動的に とマークResolvedされ、grafana_state_reason注釈が理由 でアラートインスタンスに追加されますMissingSeries

パネルからアラートを作成する

任意のパネルタイプからアラートを作成します。つまり、パネル内のクエリを再利用し、それに基づいてアラートを作成できます。

  1. ダッシュボードセクションのダッシュボードに移動します。

  2. パネルの右上隅で、3 つのドット (楕円) を選択します。

  3. ドロップダウンメニューから、その他... を選択し、新しいアラートルール を選択します。

これによりアラートルールフォームが開き、現在のパネルのクエリに基づいてアラートを設定および作成できます。