CloudWatch를 사용하여 Data Lifecycle Manager 정책 모니터링
원시 데이터를 수집하여 실시간에 가까운 읽기 쉬운 지표로 처리하는 CloudWatch를 사용하여 Amazon Data Lifecycle Manager 수명 주기 정책을 모니터링할 수 있습니다. 이러한 지표를 사용하여 정책 및 시간 경과에 따라 생성, 삭제 및 복사되는 Amazon EBS 스냅샷 개수 및 EBS 지원 AMI 개수를 정확히 확인할 수 있습니다. 특정 임계값을 주시하다가 해당 임계값이 충족될 때 알림을 전송하거나 조치를 취하도록 경보를 설정할 수도 있습니다.
지표는 15개월 동안 보관되므로 기간별 정보에 액세스하고 수명 주기 정책이 장기간 어떻게 실행되는지 더 잘 이해할 수 있습니다.
Amazon CloudWatch에 대한 자세한 내용은 Amazon CloudWatch 사용 설명서를 참조하십시오.
지원되는 지표
Data Lifecycle Manager
네임스페이스에는 Amazon Data Lifecycle Manager 수명 주기 정책에 대한 다음 지표가 포함됩니다. 지원되는 지표는 정책 유형에 따라 다릅니다.
모든 지표는 DLMPolicyId
차원에 따라 측정됩니다. 가장 유용한 통계는 sum
및 average
이고 측정 단위는 count
입니다.
탭을 선택하여 해당 정책 유형에서 지원하는 지표를 봅니다.
정책에 대한 CloudWatch 지표 보기
AWS Management Console 또는 명령줄 도구를 사용하여 Amazon Data Lifecycle Manager에서 Amazon CloudWatch로 전송하는 지표를 나열할 수 있습니다.
정책에 대한 그래프 지표
정책을 생성한 후 Amazon EC2 콘솔을 열고 모니터링(Monitoring) 탭에서 정책에 대한 모니터링 그래프를 볼 수 있습니다. 각 그래프는 사용 가능한 Amazon EC2 측정치 중 하나를 기반으로 합니다.
다음과 같은 그래프 지표를 사용할 수 있습니다.
-
대상 리소스(
ResourcesTargeted
기준) -
스냅샷 생성이 시작됨(
SnapshotsCreateStarted
기준) -
스냅샷 생성이 완료됨(
SnapshotsCreateCompleted
기준) -
스냅샷 생성 실패(
SnapshotsCreateFailed
기준) -
스냅샷 공유가 완료됨(
SnapshotsSharedCompleted
기준) -
스냅샷 삭제가 완료됨(
SnapshotsDeleteCompleted
기준) -
스냅샷 삭제 실패(
SnapshotsDeleteFailed
기준) -
스냅샷 교차 리전 복사가 시작됨(
SnapshotsCopiedRegionStarted
기준) -
스냅샷 교차 리전 복사가 완료됨(
SnapshotsCopiedRegionCompleted
기준) -
스냅샷 교차 리전 복사 실패(
SnapshotsCopiedRegionFailed
기준) -
스냅샷 교처 리전 사본 삭제가 완료됨(
SnapshotsCopiedRegionDeleteCompleted
기준) -
스냅샷 교차 리전 사본 삭제 실패(
SnapshotsCopiedRegionDeleteFailed
기준) -
스냅샷 교차 계정 복사가 시작됨(
SnapshotsCopiedAccountStarted
기준) -
스냅샷 교차 계정 복사가 완료됨(
SnapshotsCopiedAccountCompleted
기준) -
스냅샷 교차 계정 복사 실패(
SnapshotsCopiedAccountFailed
기준) -
스냅샷 교차 계정 사본 삭제가 완료됨(
SnapshotsCopiedAccountDeleteCompleted
기준) -
스냅샷 교차 계정 사본 삭제 실패(
SnapshotsCopiedAccountDeleteFailed
기준) -
AMI 생성이 시작됨(
ImagesCreateStarted
기준) -
AMI 생성이 완료됨(
ImagesCreateCompleted
기준) -
AMI 생성 실패(
ImagesCreateFailed
기준) -
AMI 등록 취소가 완료됨(
ImagesDeregisterCompleted
기준) -
AMI 등록 취소 실패(
ImagesDeregisterFailed
기준) -
AMI 교차 리전 복사가 시작됨(
ImagesCopiedRegionStarted
기준) -
AMI 교차 리전 복사가 완료됨(
ImagesCopiedRegionCompleted
기준) -
AMI 교차 리전 복사 실패(
ImagesCopiedRegionFailed
기준) -
AMI 교차 리전 사본 등록 취소가 완료됨(
ImagesCopiedRegionDeregisterCompleted
기준) -
AMI 교차 리전 사본 등록 취소 실패(
ImagesCopiedRegionDeregisteredFailed
기준) -
AMI 사용 중단 활성화가 완료됨(
EnableImageDeprecationCompleted
기준) -
AMI 사용 중단 활성화 실패(
EnableImageDeprecationFailed
기준) -
AMI 교차 리전 사본 사용 중단 활성화가 완료됨(
EnableCopiedImageDeprecationCompleted
기준) -
AMI 교차 리전 사본 사용 중단 활성화 실패(
EnableCopiedImageDeprecationFailed
기준)
정책에 대한 CloudWatch 경보 만들기
정책에 대한 CloudWatch 지표를 모니터링하는 CloudWatch 경보를 생성할 수 있습니다. 지표가 지정한 임계값에 도달하면 CloudWatch에서 자동으로 알림을 보냅니다. CloudWatch 콘솔을 이용하여 CloudWatch 경보를 생성할 수 있습니다.
CloudWatch 콘솔을 사용하여 경보를 생성하는 방법에 대한 정보는 Amazon CloudWatch 사용 설명서에서 다음 주제를 참조하세요.
사용 사례 예시
다음은 사용 사례의 예입니다.
예제 1: ResourcesTargeted 지표
ResourcesTargeted
지표를 사용하여 특정 정책이 실행될 때마다 대상이 되는 총 리소스 수를 모니터링할 수 있습니다. 이렇게 하면 대상 리소스 수가 예상 임계값보다 작거나 초과할 때 경보를 트리거할 수 있습니다.
예를 들어 일일 정책에 따라 50
볼륨 이하의 백업을 생성할 것으로 예상하는 경우, ResourcesTargeted
에 대한 sum
이 1
시간의 기간에 대해 50
보다 클 때 이메일 알림을 보내는 경보를 생성할 수 있습니다. 이렇게 하면 태그가 잘못 지정된 볼륨에서 예기치 않게 스냅샷이 생성되지 않았는지 확인할 수 있습니다.
다음 명령을 사용하여 이 경보를 생성할 수 있습니다.
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name resource-targeted-monitor \ --alarm-description "Alarm when policy targets more than 50 resources" \ --metric-name ResourcesTargeted \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 50 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
예제 2: SnapshotDeleteFailed 지표
SnapshotDeleteFailed
지표를 사용하여 정책의 스냅샷 보존 규칙에 따라 스냅샷 삭제 실패를 모니터링할 수 있습니다.
예를 들어, 스냅샷을 12시간마다 자동으로 삭제하는 정책을 작성한 경우, SnapshotDeletionFailed
의 sum
이 1
시간의 기간에 대해 0
보다 클 때 엔지니어링 팀에 알리는 경보를 만들 수 있습니다. 이렇게 하면 부적절한 스냅샷 보존을 조사하고 불필요한 스냅샷으로 인해 스토리지 비용이 증가하지 않는지 확인하는 데 도움이 될 수 있습니다.
다음 명령을 사용하여 이 경보를 생성할 수 있습니다.
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name snapshot-deletion-failed-monitor \ --alarm-description "Alarm when snapshot deletions fail" \ --metric-name SnapshotsDeleteFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
예제 3: SnapshotsCopiedRegionFailed 지표
SnapshotsCopiedRegionFailed
지표를 사용하여 정책이 스냅샷을 다른 리전으로 복사하지 못하는 시기를 식별할 수 있습니다.
예를 들어 정책이 여러 리전에 걸쳐 매일 스냅샷을 복사하는 경우, SnapshotCrossRegionCopyFailed
의 sum
이 1
시간의 기간에 대해 0
보다 클 때 엔지니어링 팀에 SMS를 보내는 경보를 만들 수 있습니다. 이 기능은 계통의 후속 스냅샷이 정책을 통해 성공적으로 복사되었는지 확인하는 데 유용할 수 있습니다.
다음 명령을 사용하여 이 경보를 생성할 수 있습니다.
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name snapshot-copy-region-failed-monitor \ --alarm-description "Alarm when snapshot copy fails" \ --metric-name SnapshotsCopiedRegionFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
실패한 작업을 보고하는 정책 관리
정책 중 하나에서 실패한 작업 지표에 대해 0이 아닌 값을 예기치 않게 보고할 경우 수행할 작업에 대한 자세한 내용은 Amazon Data Lifecycle Manager가 CloudWatch 지표에서 실패한 작업을 보고할 경우 어떻게 해야 합니까?