複合アラームのアクションの抑制
複合アラームでは複数のアラーム全体で健全性を集約して把握できるため、それらのアラームがトリガーされることが予想される状況はよくあります。例えば、アプリケーションのメンテナンス期間中や、進行中のインシデントを調査するときなどです。このような状況では、不要な通知や新しいインシデントチケットが生成されないように、複合アラームのアクションを抑制したい場合があります。
複合アラームのアクション抑制では、アラームをサプレッサーアラームとして定義します。サプレッサーアラームは、複合アラームでアクションが実行されるのを防ぐアラームです。例えば、サポートしているリソースのステータスを表すサプレッサーアラームを指定できます。サポートしているリソースがダウンしている場合、サプレッサーアラームは複合アラームによる通知の送信を妨げます。複合アラームのアクション抑制は、アラームのノイズを低減するのに役立ちます。そのため、アラームの管理に費やす時間を減らし、オペレーションに集中する時間を増やすことができます。
サプレッサーアラームは、複合アラームを設定する際に指定します。すべてのアラームは、サプレッサーアラームとして機能できます。サプレッサーアラームの状態が OK
から ALARM
に変わると、その複合アラームはアクションを停止します。サプレッサーアラームの状態が ALARM
から OK
に変わると、その複合アラームはアクションを再開します。
WaitPeriod
および ExtensionPeriod
サプレッサーアラームを指定する際は、WaitPeriod
および ExtensionPeriod
パラメータを設定します。これらのパラメータにより、サプレッサーアラームの状態の変更中に、複合アラームにより予期しないアクションが実行されるのを防ぐことができます。WaitPeriod
を使用すると、サプレッサーアラームが OK
から ALARM
に変わる際に発生する可能性のある遅延を補うことができます。例えば、サプレッサーアラームが 60 秒以内に OK
から ALARM
に変わる場合、WaitPeriod
を 60 秒に設定します。
この図では、複合アラームは t2 で OK
から ALARM
に変わります。WaitPeriod
は t2 で開始され、t8 で終了します。これにより、WaitPeriod
が t8 で期限切れになる際、複合アラームのアクションを抑制する前に、t4 でサプレッサーアラームの状態が OK
から ALARM
に変わる時間を確保できます。
ExtensionPeriod
を使用すると、サプレッサーアラームが OK
に変わった後、複合アラームが OK
に変わる際に発生する可能性のある遅延を補うことができます。例えば、サプレッサーアラームが OK
に変わってから 60 秒以内に複合アラームが OK
に変わる場合、ExtensionPeriod
を 60 秒に設定します。
この図では、サプレッサーアラームは t2 で ALARM
から OK
に変わります。ExtensionPeriod
は t2 で開始され、t8 で終了します。これにより、ExtensionPeriod
が t8 で期限切れになる前に、複合アラームが ALARM
から OK
に変わる時間を確保できます。
WaitPeriod
および ExtensionPeriod
がアクティブになるとき、複合アラームではアクションは実行されません。ExtensionPeriod
および WaitPeriod
が非アクティブになるとき、複合アラームでは現在の状態に基づいてアクションが実行されます。CloudWatch では 1 分ごとにメトリクスアラームが評価されるため、各パラメータの値は 60 秒に設定することをお勧めします。パラメータは、秒単位で任意の整数に設定できます。
次の例は、WaitPeriod
および ExtensionPeriod
を使用して、複合アラームで予期しないアクションが実行されるのを防ぐ方法を、より詳細に説明しています。
注記
次の例では、WaitPeriod
は 2 つの時間単位、ExtensionPeriod
は 3 つの時間単位として設定されています。
例
例 1: WaitPeriod
の後にアクションが抑制されない
この図では、複合アラームの状態が t2 で OK
から ALARM
に変わっています。WaitPeriod
は t2 で開始され t4 で終了するため、複合アラームでアクションが実行されるのを防ぐことができます。t4 で WaitPeriod
の期限が切れた後は、サプレッサーアラームがまだ OK
状態であるため、複合アラームでアクションが実行されます。
例 2: WaitPeriod
の期限が切れる前にアラームによりアクションが抑制される
この図では、複合アラームの状態が t2 で OK
から ALARM
に変わっています。WaitPeriod
は t2 で開始され、t4 で終了します。これにより、t3 でサプレッサーアラームの状態が OK
から ALARM
に変わる時間を確保できます。サプレッサーアラームの状態が t3 で OK
から ALARM
に変わるため、t2 で開始された WaitPeriod
は破棄されます。また、サプレッサーアラームにより複合アラームのアクションの実行が停止されます。
例 3: アクションが WaitPeriod
により抑制される場合の状態遷移
この図では、複合アラームの状態が t2 で OK
から ALARM
に変わっています。WaitPeriod
は t2 で開始され、t4 で終了します。これにより、サプレッサーアラームの状態が変わる時間を確保できます。複合アラームは t3 でOK
に戻るため、t2 で開始された WaitPeriod
は破棄されます。新たに t3 で WaitPeriod
が開始され、t5 で終了します。t5 で新しい WaitPeriod
の期限が切れると、複合アラームによりアクションが実行されます。
例 4: アクションがアラームにより抑制される場合の状態遷移
この図では、複合アラームの状態が t2 で OK
から ALARM
に変わっています。サプレッサーアラームは既に ALARM
の状態です。サプレッサーアラームにより、複合アラームによるアクションの実行が停止されます。
例 5: ExtensionPeriod
の後にアクションが抑制されない
この図では、複合アラームの状態が t2 で OK
から ALARM
に変わっています。WaitPeriod
は t2 で開始され、t4 で終了します。これにより、複合アラームのアクションを t6 まで抑制する前に、t3 でサプレッサーアラームの状態が OK
から ALARM
に変わる時間を確保できます。サプレッサーアラームの状態が t3 で OK
から ALARM
に変わるため、t2 で開始された WaitPeriod
は破棄されます。t6 で、サプレッサーアラームは OK
に変わります。ExtensionPeriod
は t6 で開始され、t9 で終了します。ExtensionPeriod
の期限が切れると、複合アラームによりアクションが実行されます。
例 6: アクションがExtensionPeriod
により抑制される場合の状態遷移
この図では、複合アラームの状態が t2 で OK
から ALARM
に変わっています。WaitPeriod
は t2 で開始され、t4 で終了します。これにより、複合アラームのアクションを t6 まで抑制する前に、t3 でサプレッサーアラームの状態が OK
から ALARM
に変わる時間を確保できます。サプレッサーアラームの状態が t3 で OK
から ALARM
に変わるため、t2 で開始された WaitPeriod
は破棄されます。t6 で、サプレッサーアラームは OK
に戻ります。ExtensionPeriod
は t6 で開始され、t9 で終了します。t7 で複合アラームが OK
に戻ると、ExtensionPeriod
は破棄されます。その後 t7 では新しい WaitPeriod
が開始され、t9 で終了します。
ヒント
アクションのサプレッサーアラームを置き換えると、アクティブな WaitPeriod
または ExtensionPeriod
は破棄されます。