복합 경보 동작 억제 - Amazon CloudWatch

복합 경보 동작 억제

복합 경보를 사용하면 여러 경보의 상태를 종합적으로 볼 수 있으며, 경보가 트리거될 것으로 예상되는 일반적인 상황이 있습니다. 예를 들어, 애플리케이션의 유지 관리 기간 중이거나 진행 중인 사고를 조사하는 경우입니다. 이러한 상황에서는 복합 경보의 동작을 억제하여 원치 않는 알림이나 새로운 인시던트 티켓이 생성되는 것을 방지할 수 있습니다

복합 경보 작업 억제 기능을 사용하면 경보를 억제 경보로 정의할 수 있습니다. 억제 경보는 복합 경보가 작업을 수행하지 않도록 합니다. 예를 들어 지원 리소스의 상태를 나타내는 억제 경보를 지정할 수 있습니다. 지원 리소스가 다운된 경우 억제 경보는 복합 경보가 알림을 보내지 못하게 합니다. 복합 경보 작업 억제 기능은 경보 노이즈를 줄이는 데 도움이 되므로, 경보를 관리하는 데 허비하는 시간을 줄이고 운영에 더 많은 시간을 할애할 수 있습니다.

억제 경보는 복합 경보를 구성할 때 지정합니다. 모든 경보는 억제 경보로 작동할 수 있습니다. 억제 경보의 상태가 OK에서 ALARM으로 변경되면 복합 경보가 더 이상 작업을 수행하지 않습니다. 억제 경보의 상태가 ALARM에서 OK로 변경되면 복합 경보가 작업을 재개합니다.

WaitPeriodExtensionPeriod

억제 경보를 지정할 때 WaitPeriodExtensionPeriod 파라미터를 설정합니다. 이들 파라미터는 억제 경보의 상태가 바뀌는 동안 복합 경보가 예기치 않게 작업을 수행하는 것을 방지합니다. WaitPeriod를 사용하여 억제 경보가 OK 상태에서 ALARM 상태로 변경될 때 발생할 수 있는 지연을 상쇄합니다. 예를 들어 억제 경보가 60초 이내에 OK 상태에서 ALARM 상태로 변경되는 경우 WaitPeriod를 60초로 설정합니다.

WaitPeriod 내의 작업 억제

이 이미지에서 복합 경보는 t2에 OK 상태에서 ALARM 상태로 변경됩니다. WaitPeriod가 t2에 시작되어 t8에 끝납니다. 이렇게 하면 t8에 WaitPeriod가 만료되어 복합 경보의 작업을 억제하기 전까지, 억제 경보가 t4에 상태를 OK에서 ALARM으로 변경할 시간을 확보할 수 있습니다.

ExtensionPeriod를 사용하여, 억제 경보가 OK 상태로 변경된 후 복합 경보가 OK 상태로 변경될 때 발생할 수 있는 지연을 상쇄합니다. 예를 들어 억제 경보가 OK 상태로 변경되고 나서 60초 이내에 복합 경보가 OK 상태로 변경되는 경우 ExtensionPeriod를 60초 설정합니다.

ExtensionPeriod 내의 작업 억제

이 이미지에서 억제 경보는 t2에 ALARM 상태에서 OK 상태로 변경됩니다. ExtensionPeriod가 t2에 시작되어 t8에 끝납니다. 이렇게 하면 t8에 ExtensionPeriod가 만료되기 전에 복합 경보가 ALARM 상태에서 OK 상태로 변경할 시간을 확보할 수 있습니다.

WaitPeriodExtensionPeriod가 활성화되면 복합 경보가 작업을 수행하지 않습니다. ExtensionPeriodWaitPeriod가 비활성화되면 복합 경보가 현재 상태에 따라 작업을 수행합니다. CloudWatch는 1분마다 지표 경보를 평가하므로 각 파라미터의 값을 60초로 설정하는 것이 좋습니다. 파라미터는 초 단위의 원하는 정수로 설정할 수 있습니다.

다음 예에서는WaitPeriodExtensionPeriod를 사용하여 복합 경보가 예기치 않게 작업을 수행하지 않도록 방지하는 방법을 자세히 설명합니다.

참고

다음 예에서 WaitPeriod는 두 시간 단위로 구성되고 ExtensionPeriod는 세 시간 단위로 구성됩니다.

예시

예 1: WaitPeriod 후에 작업이 억제되지 않음

작업 억제의 첫 번째 예

이 이미지에서 복합 경보는 t2에 OK 상태에서 ALARM 상태로 변경됩니다. WaitPeriod가 t2에 시작되어 t4에 끝나므로 복합 경보가 작업을 수행하지 못하게 할 수 있습니다. 억제 경보가 아직 OK 상태이므로, t4에 WaitPeriod가 만료되고 나면 복합 경보가 작업을 수행합니다.

예 2: WaitPeriod가 만료되기 전에 경보에 의해 동작이 억제됨

작업 억제의 두 번째 예

이 이미지에서 복합 경보는 t2에 OK 상태에서 ALARM 상태로 변경됩니다. WaitPeriod가 t2에 시작되어 t4에 끝납니다. 따라서 억제 경보가 t3에 OK 상태에서 ALARM 상태로 변경할 시간을 확보할 수 있습니다. t3에 억제 경보의 상태가 OK에서 ALARM으로 변경되므로, t2에 시작되는 WaitPeriod가 폐기되고 억제 경보가 이제 복합 경보가 작업을 수행하지 못하게 합니다.

예 3: WaitPeriod에 의해 작업이 억제될 때의 상태 전환

작업 억제의 세 번째 예

이 이미지에서 복합 경보는 t2에 OK 상태에서 ALARM 상태로 변경됩니다. WaitPeriod가 t2에 시작되어 t4에 끝납니다. 따라서 억제 경보가 상태를 변경할 시간을 확보할 수 있습니다. 복합 경보가 t3에 OK 상태로 다시 변경되므로, t2에 시작된 WaitPeriod가 폐기됩니다. 새 WaitPeriod는 t3에 시작되어 t5에 끝납니다. 새 WaitPeriod가 t5에 만료되면 복합 경보가 작업을 수행합니다.

예 4: 경보에 의해 작업이 억제될 때의 상태 전환

작업 억제의 네 번째 예

이 이미지에서 복합 경보는 t2에 OK 상태에서 ALARM 상태로 변경됩니다. 억제 경보가 이미 ALARM 상태입니다. 억제 경보는 복합 경보가 작업을 수행하는 것을 방지합니다.

예 5: ExtensionPeriod 후에 작업이 억제되지 않음

작업 억제의 다섯 번째 예

이 이미지에서 복합 경보는 t2에 OK 상태에서 ALARM 상태로 변경됩니다. WaitPeriod가 t2에 시작되어 t4에 끝납니다. 따라서 t6에 복합 경보의 작업을 억제하기 전까지, 억제 경보가 t3에 상태를 OK에서 ALARM으로 변경할 시간을 확보할 수 있습니다. t3에 억제 경보의 상태가 OK에서 ALARM으로 변경되므로, t2에 시작된 WaitPeriod가 폐기됩니다. t6에 억제 경보가 OK 상태로 변경됩니다. ExtensionPeriod가 t6에 시작되어 t9에 끝납니다. ExtensionPeriod이(가) 만료되면 복합 경보가 작업을 수행합니다.

예 6: ExtensionPeriod에 의해 작업이 억제될 때의 상태 전환

작업 억제의 여섯 번째 예

이 이미지에서 복합 경보는 t2에 OK 상태에서 ALARM 상태로 변경됩니다. WaitPeriod가 t2에 시작되어 t4에 끝납니다. 따라서 t6에 복합 경보의 작업을 억제하기 전까지, 억제 경보가 t3에 상태를 OK에서 ALARM으로 변경할 시간을 확보할 수 있습니다. t3에 억제 경보의 상태가 OK에서 ALARM으로 변경되므로, t2에 시작된 WaitPeriod가 폐기됩니다. t6에 억제 경보가 다시 OK 상태로 변경됩니다. ExtensionPeriod가 t6에 시작되어 t9에 끝납니다. t7에 복합 경보가 다시 OK 상태로 변경되면, ExtensionPeriod가 폐기되고 새 WaitPeriod가 t7에 시작되어 t9에 끝납니다.

작은 정보

억제 경보를 바꾸면 모든 활성 WaitPeriod 또는 ExtensionPeriod가 폐기됩니다.