Lightsail のメトリクスアラーム - Amazon Lightsail

Lightsail のメトリクスアラーム

Amazon Lightsail では、インスタンス、データベース、ロードバランサー、コンテンツ配信ネットワーク (CDN) ディストリビューションでの 1 つのメトリクスを監視するアラームを作成できます。アラームは、指定したしきい値を基準にしたメトリクスの値に基づいて通知するように設定できます。通知は、Lightsail コンソールに表示されるバナー、メールアドレスに送信される メール、携帯電話番号に送信される SMS テキストメッセージです。このガイドでは、アラームの条件と設定について説明します。

目次

アラームの設定

Lightsail コンソールでアラームを追加するには、インスタンス、データベース、ロードバランサーあるいは CDN ディストリビューションの [メトリクス] タブを参照します。次に、モニタリングするメトリクスを選択し、[Add alarm (アラームの追加)] を選択します。メトリクスごとに 2 つのアラームを追加できます。メトリクスの詳細については、「リソースのメトリクス」を参照してください。

アラームを設定するには、まずしきい値を特定します。しきい値は、アラームが状態を変更する時点のメトリクス値です (OK 状態から ALARM 状態への変更、またはその逆の変更など)。詳細については、「 アラームの状態」を参照してください。次に、メトリクスとしきい値の比較に使用する比較演算子を選択します。使用できる演算子は、greater than or equal togreater thanless thanless than or equal to です。

次に、アラームの状態を変更するまでに、しきい値を超える必要がある回数と、メトリクスを評価する期間を指定します。Lightsail はアラームのデータポイントを 5 分ごとに評価し、各データポイントは 5 分間の集約データを表します。たとえば、しきい値が 2 回を超えたときにトリガーするアラームを指定した場合、評価期間は過去 10 分以上 (最大 24 時間) である必要があります。しきい値を 10 回超えたときにトリガーするアラームを指定した場合、評価期間は過去 50 分以上 (最大 24 時間) である必要があります。

アラームの条件を設定したら、通知方法を設定できます。アラームが OK 状態から ALARM 状態に変化すると、通知バナーは常に Lightsail コンソールに表示されます。メールおよび SMS テキストメッセージによる通知を選択することもできますが、それらの通知連絡先を設定する必要があります。詳細については、「メトリクスの通知」を参照してください。メール、または SMS テキストメッセージによる通知を選択する場合、アラームの状態が ALARM 状態から OK 状態に変化したときに通知を受けるように選択することもできます。これは、すべてクリアな通知と見なされます。

アラームの [Advanced settings (詳細設定)] では、Lightsail が欠落しているメトリクスデータを処理する方法を選択できます。詳細については、「 アラームが欠落データを処理する方法の設定」を参照してください。

アラームの状態

アラームは、常に次の状態のいずれかになります。

  • ALARM — メトリクスの値が、定義したしきい値の範囲外にあります。

    たとえば、greater than 比較演算子を選択した場合、メトリクスが指定したしきい値を超えると、アラームは ALARM 状態になります。less than 比較演算子を選択した場合、メトリクスが指定したしきい値を下回ると、アラームは ALARM 状態になります。

  • OK: — メトリクスの値が、定義されたしきい値の範囲内にあります。

    たとえば、greater than 比較演算子を選択した場合、メトリクスが指定したしきい値を下回ると、アラームは OK 状態になります。less than 比較演算子を選択した場合、メトリクスが指定したしきい値を超えると、アラームは OK 状態になります。

  • INSUFFICIENT_DATA — アラームが開始されたか、メトリクスが利用可能でないか、またはメトリクスがアラームの状態を決定するためのデータが不足しています。

アラームは、状態変更に対してのみトリガーされます。アラームは単に、特定の状態にあるだけでは作動しません — 状態が変更されていることが条件です。アラームがトリガーされると、Lightsail コンソールにバナーが表示されます。E メールや SMS テキストメッセージで通知するようにアラームを設定することもできます。

アラームの例

前述のアラーム条件を考慮して、インスタンスの CPU 使用率が 5 分間隔の 1 回で 5% 以上になったときに ALARM 状態になるアラームを設定できます。次の例は、Lightsail コンソールでのこのアラームの設定を示しています。

CPU 使用率アラームの例。

この例では、インスタンスの CPU 使用率メトリクスが 1 つのデータポイントで 5% 以上の使用率を報告した場合、アラームは OK 状態から ALARM 状態に変化します。使用率が 5% 以上と報告された後続の各データポイントは、アラームをある ALARM 状態で維持します。インスタンスの CPU 使用率メトリクスが、1 つのデータポイントでの使用率を 4.9% 以下と報告すると、アラームは ALARM 状態から OK 状態に変わります。

次のグラフは、このアラームをさらに示しています。赤い点線は 5% の CPU 使用率のしきい値を表し、青い点はメトリクスデータポイントを表します。アラームは、最初のデータポイントの OK 状態です。2 番目のデータポイントは、データポイントがしきい値を超えているため、アラームを ALARM 状態に変更します。データポイントはしきい値よりも大きくなるため、3 番目と 4 番目のデータポイントは ALARM 状態を維持します。5 番目のデータポイントは、データポイントがしきい値を下回っているため、アラームを OK 状態に変更します。

アラームメトリクスの例。

アラームによる欠落データの処理方法の設定

場合によっては、アラームのあるメトリクスのデータポイントがレポートされないことがあります。たとえば、接続が失われたり、サーバーがダウンしたりした場合に発生します。

Lightsail では、アラームの設定時に欠落したデータポイントを処理する方法を指定できます。これは、監視しているデータの種類に応じて適切な場合、ALARM 状態に遷移するようにアラームを設定する場合に便利です。欠落データが問題を示すものではない場合の誤検出を避けることができます。

各アラームが常に 3 つの状態のいずれかであるように、データポイントはそれぞれ、次の 3 つのカテゴリのいずれかの状態に該当します。

  • Not breaching — データポイントがしきい値の範囲内です。

    たとえば、greater than 比較演算子を選択した場合、指定したしきい値を下回ったときにデータポイントが Not breaching になります。less than 比較演算子を選択した場合、指定したしきい値を超えたときにデータポイントは Not breaching になります。

  • Breaching — データポイントがしきい値の範囲外です。

    たとえば、greater than 比較演算子を選択した場合、指定したしきい値を超えたときにデータポイントが Breaching になります。less than 比較演算子を選択すると、指定したしきい値を下回ったときにデータポイントは Breaching になります。

  • Missing — 欠落しているデータポイントに対する動作は、treat missing data パラメータによって指定されます。

アラームごとに、Lightsail が欠落データポイントを次のいずれかとして処理するように指定できます。

  • Not breaching — 欠落データポイントは「正常」とされ、しきい値内として扱われます。

  • Breaching — 欠落データポイントは「不良」とされ、しきい値超過として扱われます。

  • Ignore — 現在のアラーム状態が維持されます。

  • Missing — 状態を変更するかどうかを評価する際に、アラームは欠落データポイントを考慮に入れません。これは、アラームのデフォルトの動作です。

最適な選択は、メトリクスの種類によって異なります。インスタンスの CPU 使用率などのメトリクスでは、欠落しているデータポイントをしきい値を超過として扱うことができます。これは、欠落しているデータポイントが、何かが間違っていることを示している可能性があるためです。ただし、ロードバランサーの HTTP 500 サーバーエラー数など、エラーが発生したときにのみデータポイントを生成するメトリクスでは、欠落したデータをしきい値内として扱うことができます。

アラームに最適なオプションを選択すると、不必要で誤解を招くアラームの状態の変更を防ぐことができます。また、システムの正常性をより正確に示します。

データが欠落した場合のアラーム状態の評価方法

欠落データの処理方法に設定した値にかかわらず、アラームが状態を変更するかどうかを評価する際に、Lightsail は評価期間の指定よりも多くのデータポイントを取得しようとします。取得しようとするデータポイントの正確な数は、アラーム期間の長さによって異なります。取得を試みるデータポイントのタイムフレームは評価範囲です。

Lightsail がこれらのデータポイントを取得すると、次の処理が実行されます。

  • 評価範囲内のデータポイントが欠落していない場合、Lightsail は収集された最新のデータポイントに基づいてアラームを評価します。

  • 評価範囲のデータポイントの一部が欠落しているが、取得された既存のデータポイントの数がアラームの評価期間以上である場合、正常に取得された最新の既存のデータポイントに基づいてアラームの状態が Lightsail で評価されます。この場合、欠落データを処理する方法に設定した値は不要であり、無視されます。

  • 評価範囲のデータポイントの一部が欠落しており、取得された既存のデータポイントの数がアラームの評価期間の数を下回る場合、Lightsail によって、欠落データ部分に欠落データの処理方法に指定された結果が入力され、アラームが評価されます。ただし、評価範囲内の実際のデータポイントが、報告されたタイミングにかかわらず、評価に含まれます。  Lightsail は、欠落データポイントの使用を最小限に抑えます。

これらのすべての状況で、評価されるデータポイントの数は、評価期間の値と同じです。超過している数がアラームを発生させるデータポイント数の値よりも少ない場合、アラームの状態は OK に設定されます。それ以外の場合、状態は ALARM に設定されます。

注記

この動作の特殊なケースは、メトリクスのフローが停止した後の一定期間、Lightsail アラームが最後のデータポイントのセットを繰り返し再評価する可能性があることです。この再評価により、メトリクスのストリームが停止する直前にアラームの状態が変更されていた場合に、アクションが再実行される可能性があります。この動作を軽減するには、より短い期間を使用します。

グラフ化された例の欠落データ

このセクションの次のグラフは、アラーム評価動作の例を示しています。グラフ A、B、C、D、E では、確実にアラームに違反しているデータポイントの数と評価期間は両方とも 3 になります。赤い点線はしきい値、青い点は有効なデータポイントを表し、ダッシュは欠落データを表します。しきい値ラインより上のデータポイントはしきい値を超過しており、しきい値を下回るデータポイントはしきい値内です。最新の 3 つのデータポイントの一部が欠落している場合、Lightsail は追加の有効なデータポイントを取得しようとします。

注記

アラームの作成直後にデータポイントが欠落し、アラームの作成前にメトリクスが Lightsail に報告されている場合、Lightsail はアラームを評価する際にアラーム作成前の直近のデータポイントを取得します。

グラフ A

欠落データのグラフ A。

前述のグラフ化メトリクスでは、データポイント 1 がしきい値内、データポイント 2 が欠落し、データポイント 3 がしきい値を超過し、データポイント 4 が欠落し、データポイント 5 がしきい値を超過しています。評価範囲内に有効なデータポイントが 3 つあるので、このメトリクスの欠落しているデータポイントはゼロになります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは OK 状態になります。

  • Breaching — アラームは OK 状態になります。

  • Ignore — アラームは OK 状態になります。

  • Missing — アラームは OK 状態になります。

グラフ B

欠落データのグラフ B。

前述のグラフ化メトリクスでは、データポイント 1 がしきい値内にあり、データポイント 2~5 が欠落しています。評価範囲内にデータポイントが 1 つしかないので、このメトリクスには 2 つの欠落データポイントがあります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは OK 状態になります。

  • Breaching — アラームは OK 状態になります。

  • Ignore — アラームは OK 状態になります。

  • Missing — アラームは OK 状態になります。

このシナリオでは、失われたデータがしきい値を超過として扱われる場合でも、アラームは OK 状態のままになります。これは、1 つの既存のデータポイントがしきい値内であるため、しきい値を超過として扱われる 2 つの欠落データポイントとともに評価されるためです。次回このアラームが評価されるときに、データがまだ欠落している場合は、ALARM に送られます。これは、しきい値内のデータポイントが取得された 5 つの最新のデータポイントに含まれることがなくなったためです。

グラフ C

欠落データのグラフ C。

前述のグラフ化メトリクスでは、すべてのデータポイントが欠落しています。評価範囲内のすべてのデータポイントが欠落している場合、このメトリクスには 3 つの欠落データポイントがあります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは OK 状態になります。

  • Breaching — アラームは ALARM 状態になります。

  • Ignore — アラームは現在の状態を維持します。

  • Missing — アラームは INSUFFICIENT_DATA 状態になります。

グラフ D

欠落データのグラフ D。

前述のグラフ化メトリクスでは、データポイント 1 がしきい値内、データポイント 2 がしきい値を超過し、データポイント 3 がしきい値を超過し、データポイント 4 が欠落し、データポイント 5 がしきい値を超過しています。評価範囲内に有効なデータポイントが 4 つあるので、このメトリクスの欠落しているデータポイントはゼロになります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは ALARM 状態になります。

  • Breaching — アラームは ALARM 状態になります。

  • Ignore — アラームは ALARM 状態になります。

  • Missing — アラームは ALARM 状態になります。

このシナリオでは、アラームはすべてのケースで ALARM 状態になります。これは、欠落したデータの処理方法の設定が不要で、無視される十分な実際のデータポイントがあるためです。

グラフ E

欠落データのグラフ E。

前述のグラフ化メトリクスでは、データポイント 1 と 2 が欠落し、データポイント 3 がしきい値を超過し、データポイント 4 と 5 が欠落しています。評価範囲内にデータポイントが 1 つしかないので、このメトリクスには 2 つの欠落データポイントがあります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは OK 状態になります。

  • Breaching — アラームは ALARM 状態になります。

  • Ignore — アラームは現在の状態を維持します。

  • Missing — アラームは ALARM 状態になります。

グラフF、G、H、I、J では、 アラームへのデータポイントは 2 で、評価期間は 3 です。3 中 2 、N 中 M のアラームです。5 はアラームの評価範囲です。

グラフ F

欠落データのグラフ F。

前述のグラフ化メトリクスでは、データポイント 1 がしきい値内で、データポイント 2 が欠落し、データポイント 3 がしきい値を超過し、データポイント 4 が欠落し、データポイント 5 がしきい値を超過しています。評価範囲に 3 つのデータポイントがあるので、このメトリクスの欠落したデータポイントはゼロになります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは ALARM 状態になります。

  • Breaching — アラームは ALARM 状態になります。

  • Ignore — アラームは ALARM 状態になります。

  • Missing — アラームは ALARM 状態になります。

グラフ G

欠落データのグラフ G。

前述のグラフ化メトリクスでは、データポイント 1 と 2 がしきい値内で、データポイント 3 がしきい値を超過し、データポイント 4 がしきい値内で、データポイント 5 がしきい値を超過しています。評価範囲に 5 つのデータポイントがあるので、このメトリクスの欠落データポイントはゼロになります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは ALARM 状態になります。

  • Breaching — アラームは ALARM 状態になります。

  • Ignore — アラームは ALARM 状態になります。

  • Missing — アラームは ALARM 状態になります。

グラフ H

欠落データのグラフ H。

前述のグラフ化メトリクスでは、データポイント 1 がしきい値内で、データポイント 2 が欠落し、データポイント 3 がしきい値を超過し、データポイント 4 と 5 が欠落しています。評価範囲に 2 つのデータポイントがある場合ので、このメトリクスには欠落したデータポイントが 1 つあります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは OK 状態になります。

  • Breaching — アラームは ALARM 状態になります。

  • Ignore — アラームは OK 状態になります。

  • Missing — アラームは OK 状態になります。

グラフ I

欠落データのグラフ I。

前述のグラフ化メトリクスでは、データポイント 1~4 が欠落し、データポイント 5 がしきい値内です。評価範囲に 1 つのデータポイントがあるので、このメトリクスには 2 つの欠落データポイントがあります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは OK 状態になります。

  • Breaching — アラームは ALARM 状態になります。

  • Ignore — アラームは OK 状態になります。

  • Missing — アラームは OK 状態になります。

グラフ J

欠落データのグラフ J。

前述のグラフ化メトリクスでは、データポイント 1 と 2 が欠落し、データポイント 3 がしきい値を超過し、データポイント 4 と 5 が欠落しています。評価範囲に 1 つのデータポイントがあるので、このメトリクスには 2 つの欠落データポイントがあります。欠落しているデータポイントを次のように扱うようにアラームを設定した場合:

  • Not breaching — アラームは OK 状態になります。

  • Breaching — アラームは ALARM 状態になります。

  • Ignore — アラームは現在の状態を維持します。

  • Missing — アラームは ALARM 状態になります。

アラームの詳細

ここでは、Lightsail でアラームを管理するのに役立つ記事をいくつか紹介します。