Como suprimir ações de alarme composto - Amazon CloudWatch

Como suprimir ações de alarme composto

Como os alarmes compostos permitem que você tenha uma visão agregada da sua integridade em vários alarmes, há situações comuns em que é esperado que esses alarmes sejam acionados. Por exemplo, durante uma janela de manutenção da sua aplicação ou quando você investiga um incidente em andamento. Nessas situações, talvez você queira suprimir as ações de seus alarmes compostos para evitar notificações indesejadas ou a criação de novos tíquetes de incidentes.

Com a supressão da ação de alarme composto, você define um alarme como supressor. Os alarmes supressores impedem que os alarmes compostos realizem ações. Por exemplo, você pode especificar um alarme supressor que represente o status de um recurso de suporte. Se o recurso de suporte estiver inativo, o alarme supressor impedirá que o alarme composto envie notificações. A supressão da ação do alarme composto ajuda a reduzir o ruído do alarme. Assim, você leva menos tempo gerenciando alarmes e mais tempo se concentrando em suas operações.

Você especifica alarmes supressores ao configurar alarmes compostos. Qualquer alarme pode funcionar como um alarme supressor. Quando o estado do alarme supressor muda de OK para ALARM, o alarme composto para de realizar ações. Quando o estado do alarme supressor muda de ALARM para OK, o alarme composto volta a realizar ações.

WaitPeriod e ExtensionPeriod

Ao especificar um alarme supressor, você define os parâmetros WaitPeriod e ExtensionPeriod. Esses parâmetros evitam que alarmes compostos realizem ações inesperadamente quando os alarmes supressores mudam de estado. Use o parâmetro WaitPeriod para compensar qualquer atraso que possa ocorrer quando um alarme supressor muda de OK para ALARM. Por exemplo, se um alarme supressor mudar de OK para ALARM no período de 60 segundos, defina WaitPeriod como 60 segundos.

Supressão de ações no WaitPeriod

Na imagem, o alarme composto muda de OK para ALARM em t2. Um WaitPeriod começa em t2 e termina em t8. Isso dá ao alarme supressor tempo para mudar o estado de OK para ALARM em t4 antes de suprimir as ações do alarme composto quando o WaitPeriod termina em t8.

Use o parâmetro ExtensionPeriod para compensar qualquer atraso que possa ocorrer quando um alarme composto muda para OK depois que um alarme supressor muda para OK. Por exemplo, se um alarme composto mudar para OK no período de 60 segundos após a mudança de um alarme supressor para OK, defina ExtensionPeriod como 60 segundos.

Supressão de ações no ExtensionPeriod

Na imagem, o alarme supressor muda de ALARM para OK em t2. Um ExtensionPeriod começa em t2 e termina em t8. Isso dá ao alarme composto tempo para mudar de ALARM para OK antes do final do ExtensionPeriod em t8.

Alarmes compostos não realizam ações quando WaitPeriod e ExtensionPeriod se tornam ativos. Os alarmes compostos realizam ações baseadas em seus estados atuais quando ExtensionPeriod e WaitPeriod se tornam inativos. Recomendamos que você defina o valor de cada parâmetro como 60 segundos, pois o CloudWatch avalia os alarmes de métricas a cada minuto. Você pode definir os parâmetros como qualquer número inteiro em segundos.

Os exemplos a seguir descrevem mais detalhadamente como WaitPeriod e ExtensionPeriod impedem que alarmes compostos realizem ações inesperadas.

nota

Nos exemplos a seguir, WaitPeriod está configurado como 2 unidades de tempo e ExtensionPeriod está configurado como 3 unidades de tempo.

Exemplos

Exemplo 1: as ações não são suprimidas após o WaitPeriod

primeiro exemplo de supressão de ação

Na imagem, o alarme composto muda do estado de OK para ALARM em t2. Um WaitPeriod começa em t2 e termina em t4, para evitar que o alarme composto realize uma ação. Depois que o WaitPeriod termina em t4, o alarme composto realiza as ações porque o alarme supressor ainda está no estado OK.

Exemplo 2: as ações são suprimidas pelo alarme antes no final do WaitPeriod

segundo exemplo de supressão de ação

Na imagem, o alarme composto muda do estado de OK para ALARM em t2. Um WaitPeriod começa em t2 e termina em t4. Isso dá ao alarme supressor tempo para mudar o estado de OK para ALARM em t3. Como o alarme supressor muda do estado de OK para ALARM em t3, o WaitPeriod que começou em t2 é descartado e o alarme supressor agora impede que o alarme composto realize ações.

Exemplo 3: transição de estado quando as ações são suprimidas pelo WaitPeriod

terceiro exemplo de supressão de ação

Na imagem, o alarme composto muda do estado de OK para ALARM em t2. Um WaitPeriod começa em t2 e termina em t4. Isso dá ao alarme supressor tempo para mudar de estado. O alarme composto volta para OK em t3 e o WaitPeriod que começou em t2 é descartado. Um novo WaitPeriod começa em t3 e termina em t5. Quando o novo WaitPeriod termina em t5, o alarme composto realiza as ações.

Exemplo 4: transição de estado quando as ações são suprimidas pelo alarme

quarto exemplo de supressão de ação

Na imagem, o alarme composto muda do estado de OK para ALARM em t2. O alarme supressor já está no estado ALARM. O alarme supressor impede que o alarme composto realize ações.

Exemplo 5: as ações não são suprimidas após o ExtensionPeriod

quinto exemplo de supressão de ação

Na imagem, o alarme composto muda do estado de OK para ALARM em t2. Um WaitPeriod começa em t2 e termina em t4. Isso dá ao alarme supressor tempo para mudar o estado de OK para ALARM em t3 antes de suprimir as ações do alarme composto até t6. Como o alarme supressor muda do estado de OK para ALARM em t3, o WaitPeriod que começou em t2 é descartado. Em t6, o alarme supressor muda para OK. Um ExtensionPeriod começa em t6 e termina em t9. Depois que o ExtensionPeriod termina, o alarme composto realiza as ações.

Exemplo 6: transição de estado quando as ações são suprimidas pelo ExtensionPeriod

sexto exemplo de supressão de ação

Na imagem, o alarme composto muda do estado de OK para ALARM em t2. Um WaitPeriod começa em t2 e termina em t4. Isso dá ao alarme supressor tempo para mudar o estado de OK para ALARM em t3 antes de suprimir as ações do alarme composto até t6. Como o alarme supressor muda do estado de OK para ALARM em t3, o WaitPeriod que começou em t2 é descartado. Em t6, o alarme supressor volta para OK. Um ExtensionPeriod começa em t6 e termina em t9. Quando o alarme composto volta para OK em t7, o ExtensionPeriod é descartado e um novo WaitPeriod começa em t7 e termina em t9.

dica

Se você substituir o alarme supressor de ação, qualquer WaitPeriod ou ExtensionPeriod ativo será descartado.