アラートの作成 - Amazon Managed Grafana

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

アラートの作成

このドキュメントトピックでは、Grafana でのレガシーアラートについて説明します。これは、Amazon Managed Grafana の将来のバージョンではサポートされません。Grafana アラートに移行して、最新のアラート機能を使用できます。詳細については、次のトピックのいずれかを参照してください。

Grafana バージョン 10.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 10 のアラート

Grafana バージョン 9.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 9 のアラート

Grafana バージョン 8.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana アラート

Amazon Managed Grafana アラートを使用すると、ダッシュボードパネルにルールをアタッチできます。ダッシュボードを保存すると、Amazon Managed Grafana はアラートルールを別のアラートルールストレージに抽出し、評価をスケジュールします。

グラフパネルのアラートタブで、アラートルールを評価する頻度と、アラートの状態を変更して通知を開始するために満たす必要がある条件を設定できます。

現在、アラートルールをサポートしているのはグラフパネルのみです。

アラートルールの追加または編集

  1. アラートルールを追加または編集するパネルに移動し、タイトルを選択し、編集を選択します

  2. アラート タブで、アラートの作成 を選択します。このパネルのアラートが既に存在する場合は、アラートタブのフィールドを編集できます。

  3. フィールドに入力します。詳細については、「アラートルールフィールド」を参照してください。

  4. ルールの作成が完了したら、右上隅にある保存 を選択して、アラートルールとダッシュボードを保存します。

  5. (オプションですが推奨) ルールが期待どおりの結果を返すようにするには、テストルール を選択します。

アラートルールの削除

アラートを削除するには、アラートの下部までスクロールし、「削除」を選択します。

アラートルールフィールド

このセクションでは、アラートを作成するために入力するフィールドについて説明します。

ルール

  • 名前 – わかりやすい名前を入力します。アラートルールリストに名前が表示されます。

  • すべての を評価する — スケジューラがアラートルールを評価する頻度を指定します。これは評価間隔 と呼ばれます。

  • - アラート通知がトリガーされるまでに、クエリが設定されたしきい値に違反する必要がある期間を指定します。

警告

If no data or all values are null 設定を に設定Forして を使用しないでくださいNo Data。のトリガーNo Dataはすぐにトリガーされ、For考慮されません。これにより、アラートが から移行しても OK 通知が送信されない可能性もありますNo Data -> Pending -> OK

アラートルールに が設定されForていて、クエリが設定されたしきい値に違反した場合、まず から OKに移動しますPending。Amazon Managed Grafana はPending、 から OKに移行しても通知を送信しません。アラートルールがFor期間を超えて発動している場合、 に変更Alertingされ、アラート通知が送信されます。

通常、この設定を使用することをお勧めします。アラート通知が開始されるまで数分待つよりも誤検出が発生する方が悪いことが多いためです。Alert list または を見るとAlert list panels、保留中の状態のアラートを確認できます。

条件

現在、既存の条件タイプは、クエリ文字、時間範囲、および集計関数を指定できるQuery条件のみです。

クエリ条件の例

avg() OF query(A, 15m, now) IS BELOW 14
  • avg() シリーズの値をしきい値と比較できる値に減らす方法を制御します。関数を選択して、別の集計関数に変更します。

  • query(A, 15m, now) 文字は、メトリクスタブから実行するクエリを定義します。2 番目の 2 つのパラメータは時間範囲を定義します。 15m, now は 15 分前から現在までを意味します。を使用して10m, now-2m、10 分前から 2 分前の時間範囲を定義することもできます。これは、過去 2 分間のデータを無視する場合に便利です。

  • IS BELOW 14 しきい値のタイプとしきい値を定義します。しきい値のタイプIS BELOWを変更することもできます。

アラートルールで使用されるクエリには、テンプレート変数を含めることはできません。現在、条件間の AND演算子と OR演算子のみがサポートされており、連続して実行されます。例えば、Condition:A(evaluates to: TRUE) OR condition:B(evaluates to: FALSE) AND condition:C(evaluates to: TRUE) の 3 つの条件があり、結果は ((TRUE OR FALSE) AND TRUE) = TRUE として計算されます。

複数のシリーズ

クエリが複数のシリーズを返す場合、集計関数としきい値チェックはシリーズごとに評価されます。現在、Amazon Managed Grafana はシリーズ ごとのアラートルールの状態を追跡しません。これによる影響については、次のシナリオで詳しく説明します。

  • server1 と server2 の 2 つのシリーズを返すクエリを含むアラート条件。

  • server1 シリーズにより、アラートルールが起動し、状態 に切り替わりますAlerting

  • 通知は、ロードピーク (server1) というメッセージで送信されます。

  • 同じアラートルールの後続の評価では、server2 シリーズによってアラートルールも起動されます。

  • アラートルールが既に 状態になっているため、新しい通知は送信されませんAlerting

前のシナリオからわかるように、ルールが既に 状態の場合Alerting、他のシリーズによってアラートが発せられたときに Grafana は通知を送信しません。

注記

トリガーされたアラートに対して送信されるリマインダーを設定できます。これにより、アラートが引き続き発生すると、追加の通知が送信されます。他のシリーズ (前の例の server2 など) でもアラートルールが発動する場合は、リマインダー通知に含まれます。使用している通知チャネルによっては、この機能を利用して、アラートを発生させている新規または既存のシリーズを特定できる場合があります。

データおよびエラー処理なし

次の表に、データまたは null 値のみを返すクエリをルール評価エンジンが処理する方法を制御するための条件を示します。

データオプションなし 説明
データなし アラートルールの状態を に設定しますNoData
アラート アラートルールの状態を に設定しますAlerting
最後の状態を保持する 現在のアラートルールの状態をそのまま維持します。
大阪 サポートされていますが、通常は有用ではありません。

実行エラーまたはタイムアウト

以下のオプションは、実行エラーまたはタイムアウトエラーの処理方法を Amazon Managed Grafana に指示します。

エラーまたはタイムアウトオプション 説明
アラート アラートルールの状態を に設定しますAlerting
最後の状態を保持する 現在のアラートルールの状態をそのまま維持します。

クエリがタイムアウトしたり、ランダムに失敗したりすることがある信頼できない時系列ストアがある場合は、このオプションを に設定Keep Last Stateして、基本的に無視できます。

通知

アラートタブでは、アラートルールの通知と、アラートルールに関する詳細なメッセージを指定することもできます。メッセージには、問題の解決方法に関する情報、ランブックへのリンクなど、あらゆる情報を含めることができます。

実際の通知は、複数のアラート間で設定および共有されます。通知を設定およびセットアップする方法については、「」を参照してくださいアラート通知

  • 送信先 — アラート通知チャネルを設定している場合は、そのチャネルを選択します。

  • メッセージ – 通知チャネルで送信されるテキストメッセージを入力します。一部のアラート通知機能は、テキストを HTML またはその他のリッチ形式に変換することをサポートしています。

  • タグ — 通知に含めるタグ (キーと値) のリストを指定します。これは一部の通知機能でのみサポートされています。

アラート状態履歴と注釈

アラート状態の変更は、Amazon Managed Grafana データベースの内部注釈テーブルに記録されます。状態の変化は、アラートルールのグラフパネルに注釈として視覚化されます。アラートタブのState historyサブメニューに移動して、状態履歴を表示およびクリアすることもできます。