Supresión de acciones de las alarmas compuestas - Amazon CloudWatch

Supresión de acciones de las alarmas compuestas

Como las alarmas compuestas permiten obtener una visión global de su estado de salud en varias alarmas, hay situaciones comunes en las que se espera que se activen esas alarmas. Por ejemplo, durante un período de mantenimiento de la aplicación o cuando investiga un incidente en curso. En estas situaciones, es posible que desee suprimir las acciones de sus alarmas compuestas para evitar notificaciones no deseadas o la creación de nuevos tickets de incidentes

Con la supresión de acciones de alarma compuesta, las alarmas se definen como alarmas supresoras. Las alarmas supresoras evitan que las alarmas compuestas realicen acciones. Por ejemplo, puede especificar una alarma supresora que represente el estado de un recurso de apoyo. Si el recurso de apoyo está inactivo, la alarma supresora impide que la alarma compuesta envíe notificaciones. La supresión de acciones de alarma compuesta le ayuda a reducir el ruido de las alarmas, para que pueda dedicar menos tiempo a administrar las alarmas y más a centrarse en sus operaciones.

Las alarmas supresoras quedan especificadas al configurar las alarmas compuestas. Cualquier alarma puede funcionar a modo de alarma supresora. Cuando una alarma supresora cambia de estado OK a ALARM, su alarma compuesta deja de realizar acciones. Cuando una alarma supresora cambia de estado ALARM a OK, su alarma compuesta reanuda las acciones.

WaitPeriod y ExtensionPeriod

Cuando especifica una alarma supresora, se establecen los parámetros WaitPeriod y ExtensionPeriod. Estos parámetros evitan que las alarmas compuestas realicen acciones inesperadas mientras las alarmas supresoras cambian de estado. Use WaitPeriod para compensar cualquier retraso que pueda ocurrir cuando una alarma supresora cambie de OK a ALARM. Por ejemplo, si una alarma supresora cambia de OK a ALARM en un intervalo de 60 segundos, configure WaitPeriod en 60 segundos.

Supresión de acciones en el WaitPeriod

En la imagen, la alarma compuesta cambia de OK a ALARM en t2. Un WaitPeriod comienza en t2 y termina en t8. Esto da tiempo a la alarma supresora para cambiar los estados de OK a ALARM en t4 antes de suprimir las acciones de la alarma compuesta cuando el WaitPeriod expira en t8.

Use ExtensionPeriod para compensar cualquier retraso que pueda ocurrir cuando una alarma compuesta cambie a OK después de que una alarma supresora haga lo propio a OK. Por ejemplo, si una alarma compuesta cambia a OK en un intervalo de 60 segundos desde que una alarma supresora cambia a OK, establezca ExtensionPeriod en 60 segundos.

Supresión de acciones en el ExtensionPeriod

En la imagen, la alarma supresora cambia de ALARM a OK en t2. Un ExtensionPeriod comienza en t2 y termina en t8. Esto da a la alarma compuesta el tiempo necesario para cambiar de ALARM a OK antes de que el ExtensionPeriod expire en t8.

Las alarmas compuestas no realizan acciones cuando WaitPeriod y ExtensionPeriod se vuelven activos. Las alarmas compuestas realizan acciones que se basan en sus estados de corriente cuando ExtensionPeriod y WaitPeriod se vuelven inactivos. Le recomendamos que establezca el valor de cada parámetro en 60 segundos, ya que CloudWatch evalúa las alarmas métricas cada minuto. Puede establecer los parámetros en cualquier número entero en segundos.

Los siguientes ejemplos describen con más detalle cómo WaitPeriod y ExtensionPeriod evitan que las alarmas compuestas realicen acciones inesperadas.

nota

En los siguientes ejemplos, WaitPeriod está configurado como 2 unidades de tiempo, y ExtensionPeriod está configurado como 3 unidades de tiempo.

Ejemplos

Ejemplo 1: las acciones no se suprimen después del WaitPeriod

primer ejemplo de supresión de acciones

En la imagen, la alarma compuesta cambia los estados de OK a ALARM en t2. Un WaitPeriod comienza en t2 y termina en t4, por lo que puede evitar que la alarma compuesta realice acciones. Una vez que el WaitPeriod expire en t4, la alarma compuesta realizará sus acciones, ya que la alarma supresora todavía está en OK.

Ejemplo 2: las acciones se suprimen mediante alarma antes de que el WaitPeriod expire

segundo ejemplo de supresión de acciones

En la imagen, la alarma compuesta cambia los estados de OK a ALARM en t2. Un WaitPeriod comienza en t2 y termina en t4. Esto da tiempo a la alarma supresora para cambiar los estados de OK a ALARM en t3. Debido a que la alarma supresora cambia los estados de OK a ALARM en t3, el WaitPeriod que comenzó en t2 se descarta, y la alarma supresora impide entonces que la alarma compuesta realice acciones.

Ejemplo 3: transición de estado cuando el WaitPeriod suprime las acciones

tercer ejemplo de supresión de acciones

En la imagen, la alarma compuesta cambia los estados de OK a ALARM en t2. Un WaitPeriod comienza en t2 y termina en t4. Esto da tiempo a la alarma supresora para cambiar de estado. La alarma compuesta vuelve a cambiar a OK en t3, por lo que el WaitPeriod que comenzó en t2 se descarta. Un nuevo WaitPeriod comienza en t3 y termina en t5. Una vez que el nuevo WaitPeriod expire en t5, la alarma compuesta realizará sus acciones.

Ejemplo 4: transición de estado cuando las acciones se suprimen por alarma

cuarto ejemplo de supresión de acciones

En la imagen, la alarma compuesta cambia los estados de OK a ALARM en t2. La alarma supresora ya está activada en ALARM. La alarma supresora detiene las acciones de la alarma compuesta.

Ejemplo 5: las acciones no se suprimen después del ExtensionPeriod

quinto ejemplo de supresión de acciones

En la imagen, la alarma compuesta cambia los estados de OK a ALARM en t2. Un WaitPeriod comienza en t2 y termina en t4. Esto da tiempo a la alarma supresora para cambiar los estados de OK a ALARM en t3 antes de que suprima las acciones de la alarma compuesta hasta t6. Debido a que la alarma supresora cambia los estados de OK a ALARM en t3, el WaitPeriod que comenzó en t2 se descarta. En t6, la alarma supresora cambia a OK. Un ExtensionPeriod comienza en t6 y termina en t9. Después de que el ExtensionPeriod caduca, la alarma compuesta realizará acciones.

Ejemplo 6: transición de estado cuando las acciones son suprimidas por ExtensionPeriod

sexto ejemplo de supresión de acciones

En la imagen, la alarma compuesta cambia los estados de OK a ALARM en t2. Un WaitPeriod comienza en t2 y termina en t4. Esto da tiempo a la alarma supresora para cambiar los estados de OK a ALARM en t3 antes de que suprima las acciones de la alarma compuesta hasta t6. Debido a que la alarma supresora cambia los estados de OK a ALARM en t3, el WaitPeriod que comenzó en t2 se descarta. En t6, la alarma supresora vuelve a cambiar a OK. Un ExtensionPeriod comienza en t6 y termina en t9. Cuando la alarma compuesta vuelva a cambiar a OK en t7, el ExtensionPeriod quedará descartado y un nuevo WaitPeriod comenzará en t7 y terminará en t9.

sugerencia

Si reemplaza la alarma supresora de acción, se descartará cualquier WaitPeriod o ExtensionPeriod activo.