Grafana マネージドアラートルールの作成 - Amazon Managed Grafana

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Grafana マネージドアラートルールの作成

このドキュメントトピックは、Grafana バージョン 9.x をサポートする Grafana ワークスペース向けに設計されています。

Grafana バージョン 10.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 10 での作業

Grafana バージョン 8.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 8 での作業

Grafana では、1 つ以上のデータソースをクエリし、結果を減少または変換して、相互に比較したり、固定しきい値と比較したりするアラートルールを作成できます。これらが実行されると、Grafana はコンタクトポイントに通知を送信します。

Grafana マネージドルールを追加するには
  1. Grafana コンソールの Grafana メニューでアラート (ベル) アイコンを選択して、既存のアラートを一覧表示するアラートページを開きます。

  2. 新しいアラートルール を選択します。

  3. ステップ 1 で、ルール名、タイプ、および保存場所を次のように追加します。

    • ルール名 にわかりやすい名前を追加します。この名前はアラートルールリストに表示されます。また、このルールから作成されるすべてのアラートインスタンスのalertnameラベルでもあります。

    • ルールタイプのドロップダウンから、Grafana マネージドアラート を選択します。

    • フォルダドロップダウンから、ルールを保存するフォルダを選択します。フォルダを選択しない場合、ルールはGeneralフォルダに保存されます。フォルダを作成するには、ドロップダウンを選択し、新しいフォルダ名を入力します。

  4. ステップ 2 で、評価するクエリと式を追加します。

    • デフォルト名のままにするか、カーソルを合わせ、編集アイコンを選択して名前を変更します。

    • クエリの場合は、ドロップダウンからデータソースを選択します。

    • 1 つ以上のクエリまたは式を追加します

    • 式ごとに Classic 条件を選択して 1 つのアラートルールを作成するか、数学削減再サンプリングオプションを選択して、シリーズごとに個別のアラートを生成します。これらのオプションの詳細については、「」を参照してください単一および多次元ルール

    • クエリの実行 を選択して、クエリが成功したことを確認します。

  5. ステップ 3 で、条件を追加します。

    • 条件ドロップダウンから、クエリまたは式を選択してアラートルールを開始します。

    • すべての を評価する で、評価の頻度を指定します。10 秒の倍数である必要があります。例えば、1m30s などです。

    • の評価 では、アラートが開始される前に条件が true である必要がある期間を指定します。

      注記

      条件に違反すると、アラートは Pending状態になります。指定された期間、条件が超過したままの場合、アラートは Firing状態に移行します。満たされなくなった場合は、 Normal状態に戻ります。

    • 「データとエラー処理を設定しない」で、データがない場合のアラート動作を設定します。 のガイドラインを使用しますデータまたはエラーケースなしの処理

    • アラートのプレビューを選択して、現時点でクエリを実行した結果を確認します。プレビューでは、データとエラー処理条件は除外されます。

  6. ステップ 4 で、ルールに関連付けられたメタデータを追加します。

    • 説明と概要を追加して、アラートメッセージをカスタマイズします。のガイドラインを使用しますラベルと注釈

    • ランブック URL、パネル、ダッシュボード、アラート IDsを追加します。

    • カスタムラベルを追加します。

  7. 保存を選択してルールを保存するか、保存して終了を選択してルールを保存し、アラートページに戻ります。

ルールを作成したら、ルールの通知を作成できます。通知の詳細については、「アラート通知を管理する」を参照してください。

単一および多次元ルール

Grafana マネージドアラートルールでは、従来の条件を使用してルールを作成することも、多次元ルールを作成することもできます。

単一次元ルール (クラシック条件)

クラシック条件式を使用して、条件が満たされたときに単一のアラートを開始するルールを作成します。複数のシリーズを返すクエリの場合、Grafana は各シリーズのアラート状態を追跡しません。その結果、複数のシリーズでアラート条件が満たされた場合でも、Grafana は 1 つのアラートのみを送信します。

式のフォーマット方法の詳細については、Grafana ドキュメント「式」を参照してください。

多次元ルール

クエリで返されるシリーズごとに個別のアラートインスタンスを生成するには、多次元ルールを作成します。

注記

多次元ルールによって生成された各アラートインスタンスは、アラートの合計クォータにカウントされます。アラートのクォータに達した場合、ルールは評価されません。多次元ルールのクォータの詳細については、「」を参照してくださいクォータ到達エラー

1 つのルールから複数のインスタンスを作成するには、MathReduce、または Resample式を使用して多次元ルールを作成します。例えば、以下のことが可能です。

  • 選択した時間範囲の値を 1 つの値に集約するには、各クエリにReduce式を追加します。(数値データ を使用するルールには必要ありません)。

  • ルールの条件を持つMath式を追加します。これは、ルールがアラートを開始すべきでない場合、クエリまたは reduce 式が既に 0 を返す場合や、アラートを開始する必要がある場合は正の数値を返す場合は必要ありません。

    例:

    • $B > 70 B クエリ/式の値が 70 を超える場合にアラートを開始するかどうか。

    • $B < $C * 100 は、B の値が C の値に 100 を掛けた値よりも小さい場合にアラートを開始する必要があります。比較されるクエリの結果に複数のシリーズがある場合、異なるクエリのシリーズが同じラベルを持っているか、一方が他のクエリのサブセットである場合、それらが照合されます。

注記

Grafana は、テンプレート変数を使用したアラートクエリをサポートしていません。詳細については、コミュニティページ「テンプレート変数は、アラート の設定中にアラートクエリでサポートされていません」を参照してください。

多次元ルールのパフォーマンスに関する考慮事項

各アラートインスタンスは、アラートクォータにカウントされます。アラートクォータ内で対応できる数よりも多くのインスタンスを作成する多次元ルールは評価されず、クォータエラーが返されます。詳細については、「クォータ到達エラー」を参照してください。

多次元アラートは、Grafana ワークスペースのパフォーマンスや、Grafana がアラートルールを評価するためにクエリを実行する際のデータソースのパフォーマンスに大きな影響を与える可能性があります。以下の考慮事項は、モニタリングシステムのパフォーマンスを最適化する際に役立ちます。

  • ルール評価の頻度 – アラートルールのすべての評価プロパティは、ルール評価の頻度を制御します。許容される最も低い評価頻度を使用することをお勧めします。

  • 結果セットの基数 – ルールで作成するアラートインスタンスの数は、そのパフォーマンスに影響します。フリート内のすべての VM で、すべての API パスの API レスポンスエラーをモニタリングしているとします。このセットには、パスの数に VMs。例えば、VM ごとのパスごとではなく、VM ごとの合計エラーをモニタリングすることで、結果セットの基数を減らすことができます。

  • クエリの複雑さ — データソースが処理して応答できるクエリは、消費するリソースをすばやく減らすことができます。この考慮事項は上記の他の考慮事項ほど重要ではありませんが、それらをできるだけ減らすと、個々のクエリのパフォーマンスを見ると違いが生じる可能性があります。また、これらのルールの評価がデータソースに与える影響にも注意してください。アラートクエリは、データベースのモニタリングによって処理されるクエリの大部分であることが多いため、Grafana インスタンスに影響するのと同じ負荷要因がクエリにも影響します。

クォータ到達エラー

1 つのワークスペース内に保持できるアラートインスタンスの数にはクォータがあります。この数に達すると、そのワークスペースに新しいアラートルールを作成できなくなります。多次元アラートでは、アラートインスタンスの数は時間の経過とともに変化する可能性があります。

アラートインスタンスを使用する際に覚えておくべき重要な点は次のとおりです。

  • 単一ディメンションルールのみを作成する場合、各ルールは単一のアラートインスタンスです。1 つのワークスペースに、アラートインスタンスのクォータと同じ数のルールを作成できます。

  • 多次元ルールは複数のアラートインスタンスを作成しますが、その数は評価されるまでわかりません。例えば、Amazon EC2 インスタンスの CPU 使用率を追跡するアラートルールを作成すると、作成時に 50 個の EC2 インスタンス (つまり 50 個のアラートインスタンス) が存在する可能性がありますが、1 週間後にさらに 10 個の EC2 インスタンスを追加すると、次の評価には 60 個のアラートインスタンスが含まれます。

    アラートインスタンスの数は、多次元アラートを作成するときに評価されます。アラートインスタンスのクォータをすぐに超えるアラートインスタンスを作成することはできません。アラートインスタンスの数は変わる可能性があるため、クォータはルールが評価されるたびにチェックされます。

  • ルールの評価時に、ルールによってアラートインスタンスのクォータを超えた場合、アラートインスタンスの合計数がサービスクォータを下回るアラートルールが更新されるまで、そのルールは評価されません。この場合、クォータに達したことを通知するアラート通知を受け取ります (通知は評価対象のルールの通知ポリシーを使用します)。通知には、値 のError注釈が含まれていますQuotaReachedError

  • が評価QuotaReachedErrorを停止するルール。評価は、更新が行われ、更新後の評価によってそれ自体が が発生しない場合にのみ再開されますQuotaReachedError。評価されていないルールは、Grafana コンソールでクォータ到達エラーを表示します。

  • アラートルールを削除するか、多次元アラートを編集してアラートインスタンスの数を減らすことができます (例えば、VM 内の API ごとに 1 つのアラートではなく、VM ごとに 1 つのエラーに対して 1 つのアラートを設定するなど)。

  • 評価を再開するには、アラートを更新して保存します。アラートインスタンスの数を減らすように更新することも、アラートインスタンスの数を減らすために他の変更を加えた場合は、変更なしで保存することもできます。再開できる場合は、 です。別の が発生した場合はQuotaReachedError、保存できません。

  • アラートが保存され、アラートクォータを超過せずに評価を再開すると、クォータ到達エラーがしばらくの間 (評価間隔まで) Grafana コンソールに表示され続ける可能性がありますが、ルールのしきい値が満たされると、アラートルールの評価が開始され、アラートが送信されます。

  • アラートクォータおよびその他のクォータの詳細については、「」を参照してくださいAmazon Managed Grafana サービスクォータ

データまたはエラーケースなしの処理

データがない場合やエラーが発生した場合のアラート動作の処理方法のオプションを選択します。

データを処理しないためのオプションを次の表に示します。

データなしオプション Behavior

データなし

アラートルールの名前と UID、およびラベルとしてデータを返さないデータソースの UID DatasourceNoDataを含むアラートを作成します。

アラート

アラートルールの状態を に設定しますAlerting

OK

アラートルールの状態を に設定しますNormal

エラーケースを処理するためのオプションを次の表に示します。

エラーまたはタイムアウトオプション Behavior

アラート

アラートルールの状態を に設定する Alerting

OK

アラートルールの状態を に設定する Normal

エラー

アラートルールの名前と UID、およびラベルとしてデータを返さないデータソースの UID DatasourceErrorを含むアラートを作成します。