複合アラームのアクションの抑制 - Amazon CloudWatch

複合アラームのアクションの抑制

複合アラームでは複数のアラーム全体で健全性を集約して把握できるため、それらのアラームがトリガーされることが予想される状況はよくあります。例えば、アプリケーションのメンテナンス期間中や、進行中のインシデントを調査するときなどです。このような状況では、不要な通知や新しいインシデントチケットが生成されないように、複合アラームのアクションを抑制したい場合があります。

複合アラームのアクション抑制では、アラームをサプレッサーアラームとして定義します。サプレッサーアラームは、複合アラームでアクションが実行されるのを防ぐアラームです。例えば、サポートしているリソースのステータスを表すサプレッサーアラームを指定できます。サポートしているリソースがダウンしている場合、サプレッサーアラームは複合アラームによる通知の送信を妨げます。複合アラームのアクション抑制は、アラームのノイズを低減するのに役立ちます。そのため、アラームの管理に費やす時間を減らし、オペレーションに集中する時間を増やすことができます。

サプレッサーアラームは、複合アラームを設定する際に指定します。すべてのアラームは、サプレッサーアラームとして機能できます。サプレッサーアラームの状態が OK から ALARM に変わると、その複合アラームはアクションを停止します。サプレッサーアラームの状態が ALARM から OK に変わると、その複合アラームはアクションを再開します。

WaitPeriod および ExtensionPeriod

サプレッサーアラームを指定する際は、WaitPeriod および ExtensionPeriod パラメータを設定します。これらのパラメータにより、サプレッサーアラームの状態の変更中に、複合アラームにより予期しないアクションが実行されるのを防ぐことができます。WaitPeriod を使用すると、サプレッサーアラームが OK から ALARM に変わる際に発生する可能性のある遅延を補うことができます。例えば、サプレッサーアラームが 60 秒以内に OK から ALARM に変わる場合、WaitPeriod を 60 秒に設定します。

WaitPeriod 内のアクション抑制

この図では、複合アラームは t2 で OK から ALARM に変わります。WaitPeriod は t2 で開始され、t8 で終了します。これにより、WaitPeriod が t8 で期限切れになる際、複合アラームのアクションを抑制する前に、t4 でサプレッサーアラームの状態が OK から ALARM に変わる時間を確保できます。

ExtensionPeriod を使用すると、サプレッサーアラームが OK に変わった後、複合アラームが OK に変わる際に発生する可能性のある遅延を補うことができます。例えば、サプレッサーアラームが OK に変わってから 60 秒以内に複合アラームが OK に変わる場合、ExtensionPeriod を 60 秒に設定します。

ExtensionPeriod 内のアクション抑制

この図では、サプレッサーアラームは t2 で ALARM から OK に変わります。ExtensionPeriod は t2 で開始され、t8 で終了します。これにより、ExtensionPeriod が t8 で期限切れになる前に、複合アラームが ALARM から OK に変わる時間を確保できます。

WaitPeriod および ExtensionPeriod がアクティブになるとき、複合アラームではアクションは実行されません。ExtensionPeriod および WaitPeriod が非アクティブになるとき、複合アラームでは現在の状態に基づいてアクションが実行されます。CloudWatch では 1 分ごとにメトリクスアラームが評価されるため、各パラメータの値は 60 秒に設定することをお勧めします。パラメータは、秒単位で任意の整数に設定できます。

次の例は、WaitPeriod および ExtensionPeriod を使用して、複合アラームで予期しないアクションが実行されるのを防ぐ方法を、より詳細に説明しています。

注記

次の例では、WaitPeriod は 2 つの時間単位、ExtensionPeriod は 3 つの時間単位として設定されています。

例 1: WaitPeriod の後にアクションが抑制されない

第 1 のアクション抑制の例

この図では、複合アラームの状態が t2 で OK から ALARM に変わっています。WaitPeriod は t2 で開始され t4 で終了するため、複合アラームでアクションが実行されるのを防ぐことができます。t4 で WaitPeriod の期限が切れた後は、サプレッサーアラームがまだ OK 状態であるため、複合アラームでアクションが実行されます。

例 2: WaitPeriod の期限が切れる前にアラームによりアクションが抑制される

第 2 のアクション抑制の例

この図では、複合アラームの状態が t2 で OK から ALARM に変わっています。WaitPeriod は t2 で開始され、t4 で終了します。これにより、t3 でサプレッサーアラームの状態が OK から ALARM に変わる時間を確保できます。サプレッサーアラームの状態が t3 で OK から ALARM に変わるため、t2 で開始された WaitPeriod は破棄されます。また、サプレッサーアラームにより複合アラームのアクションの実行が停止されます。

例 3: アクションが WaitPeriod により抑制される場合の状態遷移

第 3 のアクション抑制の例

この図では、複合アラームの状態が t2 で OK から ALARM に変わっています。WaitPeriod は t2 で開始され、t4 で終了します。これにより、サプレッサーアラームの状態が変わる時間を確保できます。複合アラームは t3 でOK に戻るため、t2 で開始された WaitPeriod は破棄されます。新たに t3 で WaitPeriod が開始され、t5 で終了します。t5 で新しい WaitPeriod の期限が切れると、複合アラームによりアクションが実行されます。

例 4: アクションがアラームにより抑制される場合の状態遷移

第 4 のアクション抑制の例

この図では、複合アラームの状態が t2 で OK から ALARM に変わっています。サプレッサーアラームは既に ALARM の状態です。サプレッサーアラームにより、複合アラームによるアクションの実行が停止されます。

例 5: ExtensionPeriod の後にアクションが抑制されない

第 5 のアクション抑制の例

この図では、複合アラームの状態が t2 で OK から ALARM に変わっています。WaitPeriod は t2 で開始され、t4 で終了します。これにより、複合アラームのアクションを t6 まで抑制する前に、t3 でサプレッサーアラームの状態が OK から ALARM に変わる時間を確保できます。サプレッサーアラームの状態が t3 で OK から ALARM に変わるため、t2 で開始された WaitPeriod は破棄されます。t6 で、サプレッサーアラームは OK に変わります。ExtensionPeriod は t6 で開始され、t9 で終了します。ExtensionPeriod の期限が切れると、複合アラームによりアクションが実行されます。

例 6: アクションがExtensionPeriod により抑制される場合の状態遷移

第 6 のアクション抑制の例

この図では、複合アラームの状態が t2 で OK から ALARM に変わっています。WaitPeriod は t2 で開始され、t4 で終了します。これにより、複合アラームのアクションを t6 まで抑制する前に、t3 でサプレッサーアラームの状態が OK から ALARM に変わる時間を確保できます。サプレッサーアラームの状態が t3 で OK から ALARM に変わるため、t2 で開始された WaitPeriod は破棄されます。t6 で、サプレッサーアラームは OK に戻ります。ExtensionPeriod は t6 で開始され、t9 で終了します。t7 で複合アラームが OK に戻ると、ExtensionPeriod は破棄されます。その後 t7 では新しい WaitPeriod が開始され、t9 で終了します。

ヒント

アクションのサプレッサーアラームを置き換えると、アクティブな WaitPeriod または ExtensionPeriod は破棄されます。