CloudWatch를 사용하여 Data Lifecycle Manager 정책 모니터링 - Amazon EBS

CloudWatch를 사용하여 Data Lifecycle Manager 정책 모니터링

원시 데이터를 수집하여 실시간에 가까운 읽기 쉬운 지표로 처리하는 CloudWatch를 사용하여 Amazon Data Lifecycle Manager 수명 주기 정책을 모니터링할 수 있습니다. 이러한 지표를 사용하여 정책 및 시간 경과에 따라 생성, 삭제 및 복사되는 Amazon EBS 스냅샷 개수 및 EBS 지원 AMI 개수를 정확히 확인할 수 있습니다. 특정 임계값을 주시하다가 해당 임계값이 충족될 때 알림을 전송하거나 조치를 취하도록 경보를 설정할 수도 있습니다.

지표는 15개월 동안 보관되므로 기간별 정보에 액세스하고 수명 주기 정책이 장기간 어떻게 실행되는지 더 잘 이해할 수 있습니다.

Amazon CloudWatch에 대한 자세한 내용은 Amazon CloudWatch 사용 설명서를 참조하십시오.

지원되는 지표

Data Lifecycle Manager 네임스페이스에는 Amazon Data Lifecycle Manager 수명 주기 정책에 대한 다음 지표가 포함됩니다. 지원되는 지표는 정책 유형에 따라 다릅니다.

모든 지표는 DLMPolicyId 차원에 따라 측정됩니다. 가장 유용한 통계는 sumaverage이고 측정 단위는 count입니다.

탭을 선택하여 해당 정책 유형에서 지원하는 지표를 봅니다.

EBS snapshot policies
지표 설명

ResourcesTargeted

스냅샷 또는 EBS 지원 AMI 정책에서 지정한 태그의 대상이 되는 리소스 수입니다.

SnapshotsCreateStarted

스냅샷 정책을 통해 시작한 스냅샷 생성 작업의 수입니다. 재시도를 여러 번 연속으로 수행한 경우에도 각 작업은 한 번만 기록됩니다.

스냅샷 생성 작업이 실패할 경우 Amazon Data Lifecycle Manager는 SnapshotsCreateFailed 지표를 전송합니다.

SnapshotsCreateCompleted

스냅샷 정책에서 생성한 스냅샷 수입니다. 여기에는 예약된 시간으로부터 60분 이내에 성공한 재시도를 포함합니다.

SnapshotsCreateFailed

스냅샷 정책에서 생성할 수 없는 스냅샷 수입니다. 여기에는 예약된 시간으로부터 60분 이내에 실패한 재시도를 포함합니다.

SnapshotsSharedCompleted

스냅샷 정책을 통해 계정 간에 공유되는 스냅샷 수입니다.

SnapshotsDeleteCompleted

스냅샷 또는 EBS 지원 AMI 정책을 통해 삭제한 스냅샷 수입니다. 이 지표는 정책을 통해 생성한 스냅샷에만 적용됩니다. 정책을 통해 생성한 교차 리전 스냅샷 복사본에는 적용되지 않습니다.

이 지표에는 EBS 지원 AMI 정책이 AMI를 등록 취소할 때 삭제되는 스냅샷을 포함합니다.

SnapshotsDeleteFailed

스냅샷 또는 EBS 지원 AMI 정책을 통해 삭제할 수 없는 스냅샷 수입니다. 이 지표는 정책을 통해 생성한 스냅샷에만 적용됩니다. 정책을 통해 생성한 교차 리전 스냅샷 복사본에는 적용되지 않습니다.

이 지표에는 EBS 지원 AMI 정책이 AMI를 등록 취소할 때 삭제되는 스냅샷을 포함합니다.

SnapshotsCopiedRegionStarted

스냅샷 정책을 통해 시작한 교차 리전 스냅샷 복사 작업의 수입니다.

SnapshotsCopiedRegionCompleted

스냅샷 정책을 통해 생성한 교차 리전 스냅샷 복사본 수입니다. 여기에는 예약된 시간으로부터 24시간 이내에 성공한 재시도를 포함합니다.

SnapshotsCopiedRegionFailed

스냅샷 정책을 통해 생성할 수 없는 교차 리전 스냅샷 복사본 수입니다. 여기에는 예약된 시간으로부터 24시간 이내에 실패한 재시도를 포함합니다.

SnapshotsCopiedRegionDeleteCompleted

보존 규칙에서 지정한 대로 스냅샷 정책을 통해 삭제한 교차 리전 스냅샷 복사본의 수입니다.

SnapshotsCopiedRegionDeleteFailed

보존 규칙에서 지정한 대로 스냅샷 정책을 통해 삭제할 수 없는 교차 리전 스냅샷 복사본의 수입니다.

snapshotsArchiveDeletionFailed

스냅샷 정책에 따라 아카이브 티어에서 삭제할 수 없었던 아카이빙된 스냅샷 수입니다.

snapshotsArchiveScheduled

스냅샷 정책에 따라 아카이빙이 예약된 스냅샷 수입니다.

snapshotsArchiveCompleted

스냅샷 정책에 따라 아카이빙된 스냅샷 수입니다.

snapshotsArchiveFailed

스냅샷 정책 따라 아카이빙할 수 없었던 스냅샷 수입니다.

snapshotsArchiveDeletionCompleted

스냅샷 정책에 따라 아카이브 티어에서 삭제된 아카이빙된 스냅샷 수입니다.

PreScriptStarted

사전 스크립트가 성공적으로 시작된 인스턴스 수입니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

PreScriptCompleted

사전 스크립트가 성공적으로 완료된 인스턴스 수입니다. 사전 스크립트가 지정된 제한 시간을 벗어나 완료되는 경우에도 지표가 내보내집니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

PreScriptFailed

사전 스크립트가 성공적으로 완료되지 못한 인스턴스 수입니다. 사전 스크립트가 지정된 제한 시간을 벗어나 완료되는 경우에도 지표가 내보내집니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

PostScriptStarted

사후 스크립트가 성공적으로 시작된 인스턴스 수입니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

PostScriptCompleted

사후 스크립트가 성공적으로 완료된 인스턴스 수입니다. 사후 스크립트가 지정된 제한 시간을 벗어나 완료되는 경우에도 지표가 내보내집니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

PostScriptFailed

사후 스크립트가 성공적으로 완료되지 못한 인스턴스 수입니다. 사후 스크립트가 지정된 제한 시간을 벗어나 완료되는 경우에도 지표가 내보내집니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

VSSBackupStarted

VSS 백업이 성공적으로 시작된 인스턴스 수입니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

VSSBackupCompleted

VSS 백업이 성공적으로 완료된 인스턴스 수입니다. VSS 백업이 제한 시간을 벗어나 완료되는 경우에도 지표가 내보내집니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

VSSBackupFailed

VSS 백업이 성공적으로 완료되지 못한 인스턴스 수입니다. VSS 백업이 제한 시간을 벗어나 완료되는 경우에도 지표가 내보내집니다.

스크립트 재시도가 활성화된 경우 정책 실행당 이 지표가 여러 번 내보내질 수 있습니다.

EBS-backed AMI policies

EBS 지원 AMI 정책과 함께 사용할 수 있는 지표는 다음과 같습니다.

지표 설명

ResourcesTargeted

스냅샷 또는 EBS 지원 AMI 정책에서 지정한 태그의 대상이 되는 리소스 수입니다.

SnapshotsDeleteCompleted

스냅샷 또는 EBS 지원 AMI 정책을 통해 삭제한 스냅샷 수입니다. 이 지표는 정책을 통해 생성한 스냅샷에만 적용됩니다. 정책을 통해 생성한 교차 리전 스냅샷 복사본에는 적용되지 않습니다.

이 지표에는 EBS 지원 AMI 정책이 AMI를 등록 취소할 때 삭제되는 스냅샷을 포함합니다.

SnapshotsDeleteFailed

스냅샷 또는 EBS 지원 AMI 정책을 통해 삭제할 수 없는 스냅샷 수입니다. 이 지표는 정책을 통해 생성한 스냅샷에만 적용됩니다. 정책을 통해 생성한 교차 리전 스냅샷 복사본에는 적용되지 않습니다.

이 지표에는 EBS 지원 AMI 정책이 AMI를 등록 취소할 때 삭제되는 스냅샷을 포함합니다.

SnapshotsCopiedRegionDeleteCompleted

보존 규칙에서 지정한 대로 스냅샷 정책을 통해 삭제한 교차 리전 스냅샷 복사본의 수입니다.

SnapshotsCopiedRegionDeleteFailed

보존 규칙에서 지정한 대로 스냅샷 정책을 통해 삭제할 수 없는 교차 리전 스냅샷 복사본의 수입니다.

ImagesCreateStarted

EBS 지원 AMI 정책을 통해 시작한 CreateImage 작업 수입니다.

ImagesCreateCompleted

EBS 지원 AMI 정책을 통해 생성한 AMI 수입니다.

ImagesCreateFailed

EBS 지원 AMI 정책을 통해 생성할 수 없는 AMI 수입니다.

ImagesDeregisterCompleted

EBS 지원 AMI 정책을 통해 등록 취소된 AMI 수입니다.

ImagesDeregisterFailed

EBS 지원 AMI 정책을 통해 등록 취소할 수 없는 AMI 수입니다.

ImagesCopiedRegionStarted

EBS 지원 AMI 정책을 통해 시작한 교차 리전 복사 작업의 수입니다.

ImagesCopiedRegionCompleted

EBS 지원 AMI 정책을 통해 생성한 교차 리전 AMI 복사본 수입니다.

ImagesCopiedRegionFailed

EBS 지원 AMI 정책을 통해 생성할 수 없는 교차 리전 AMI 복사본 수입니다.

ImagesCopiedRegionDeregisterCompleted

보존 규칙에서 지정한 대로 EBS 지원 AMI 정책을 통해 등록 취소된 교차 리전 AMI 복사본의 수입니다.

ImagesCopiedRegionDeregisteredFailed

보존 규칙에서 지정한 대로 EBS 지원 AMI 정책을 통해 등록 취소할 수 없는 교차 리전 AMI 복사본의 수입니다.

EnableImageDeprecationCompleted

EBS 지원 AMI 정책에 의해 사용 중단으로 표시된 AMI 수입니다.

EnableImageDeprecationFailed

EBS 지원 AMI 정책에 의해 사용 중단으로 표시될 수 없는 AMI 수입니다.

EnableCopiedImageDeprecationCompleted

EBS 지원 AMI 정책에 의해 사용 중단으로 표시된 교차 리전 AMI 사본의 수입니다.

EnableCopiedImageDeprecationFailed

EBS 지원 AMI 정책에 의해 사용 중단으로 표시될 수 없는 교차 리전 AMI 사본의 수입니다.

Cross-account copy event policies

다음 지표는 교차 계정 복사 이벤트 정책과 함께 사용할 수 있습니다.

지표 설명

SnapshotsCopiedAccountStarted

교차 계정 복사 이벤트 정책을 통해 시작한 교차 계정 스냅샷 복사 작업의 수입니다.

SnapshotsCopiedAccountCompleted

교차 계정 복사 이벤트 정책을 통해 다른 계정에서 복사된 스냅샷 수입니다. 여기에는 예약된 시간으로부터 24시간 이내에 성공한 재시도를 포함합니다.

SnapshotsCopiedAccountFailed

교차 계정 복사 이벤트 정책을 통해 다른 계정에서 복사할 수 없는 스냅샷 수입니다. 여기에는 예약된 시간으로부터 24시간 이내에 실패한 재시도를 포함합니다.

SnapshotsCopiedAccountDeleteCompleted

교차 계정 복사 이벤트 정책을 통해 보존 규칙에서 지정된 대로 삭제한 교차 리전 스냅샷 복사본의 수입니다.

SnapshotsCopiedAccountDeleteFailed

교차 계정 복사 이벤트 정책을 통해 보존 규칙에서 지정된 대로 삭제할 수 없는 교차 리전 스냅샷 복사본의 수입니다.

정책에 대한 CloudWatch 지표 보기

AWS Management Console 또는 명령줄 도구를 사용하여 Amazon Data Lifecycle Manager에서 Amazon CloudWatch로 전송하는 지표를 나열할 수 있습니다.

Amazon EC2 console
Amazon EC2 콘솔을 사용하여 지표를 보려면
  1. https://console.aws.amazon.com/ec2/에서 Amazon EC2 콘솔을 엽니다.

  2. 탐색 창에서 수명 주기 관리자(Lifecycle Manager)를 선택합니다.

  3. 그리드에서 정책을 선택한 다음 모니터링(Monitoring) 탭을 선택합니다.

CloudWatch console
Amazon CloudWatch 콘솔을 사용한 지표 확인
  1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  2. 탐색 창에서 지표를 선택합니다.

  3. EBS 네임스페이스를 선택한 다음 [Data Lifecycle Manager 지표(Data Lifecycle Manager metrics)]를 선택합니다.

AWS CLI
Amazon Data Lifecycle Manager에 대해 사용 가능한 모든 지표를 나열하려면

list-metrics 명령을 사용합니다.

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS
특정 정책에 대한 모든 지표를 나열하려면

list-metrics 명령을 사용하여 DLMPolicyId 차원을 지정합니다.

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS \ --dimensions Name=DLMPolicyId,Value=policy-abcdef01234567890
모든 정책에서 단일 지표를 나열하려면

list-metrics 명령을 사용하여 --metric-name 옵션을 지정합니다.

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS \ --metric-name SnapshotsCreateCompleted

정책에 대한 그래프 지표

정책을 생성한 후 Amazon EC2 콘솔을 열고 모니터링(Monitoring) 탭에서 정책에 대한 모니터링 그래프를 볼 수 있습니다. 각 그래프는 사용 가능한 Amazon EC2 측정치 중 하나를 기반으로 합니다.

다음과 같은 그래프 지표를 사용할 수 있습니다.

  • 대상 리소스(ResourcesTargeted 기준)

  • 스냅샷 생성이 시작됨(SnapshotsCreateStarted 기준)

  • 스냅샷 생성이 완료됨(SnapshotsCreateCompleted 기준)

  • 스냅샷 생성 실패(SnapshotsCreateFailed 기준)

  • 스냅샷 공유가 완료됨(SnapshotsSharedCompleted 기준)

  • 스냅샷 삭제가 완료됨(SnapshotsDeleteCompleted 기준)

  • 스냅샷 삭제 실패(SnapshotsDeleteFailed 기준)

  • 스냅샷 교차 리전 복사가 시작됨(SnapshotsCopiedRegionStarted 기준)

  • 스냅샷 교차 리전 복사가 완료됨(SnapshotsCopiedRegionCompleted 기준)

  • 스냅샷 교차 리전 복사 실패(SnapshotsCopiedRegionFailed 기준)

  • 스냅샷 교처 리전 사본 삭제가 완료됨(SnapshotsCopiedRegionDeleteCompleted 기준)

  • 스냅샷 교차 리전 사본 삭제 실패(SnapshotsCopiedRegionDeleteFailed 기준)

  • 스냅샷 교차 계정 복사가 시작됨(SnapshotsCopiedAccountStarted 기준)

  • 스냅샷 교차 계정 복사가 완료됨(SnapshotsCopiedAccountCompleted 기준)

  • 스냅샷 교차 계정 복사 실패(SnapshotsCopiedAccountFailed 기준)

  • 스냅샷 교차 계정 사본 삭제가 완료됨(SnapshotsCopiedAccountDeleteCompleted 기준)

  • 스냅샷 교차 계정 사본 삭제 실패(SnapshotsCopiedAccountDeleteFailed 기준)

  • AMI 생성이 시작됨(ImagesCreateStarted 기준)

  • AMI 생성이 완료됨(ImagesCreateCompleted 기준)

  • AMI 생성 실패(ImagesCreateFailed 기준)

  • AMI 등록 취소가 완료됨(ImagesDeregisterCompleted 기준)

  • AMI 등록 취소 실패(ImagesDeregisterFailed 기준)

  • AMI 교차 리전 복사가 시작됨(ImagesCopiedRegionStarted 기준)

  • AMI 교차 리전 복사가 완료됨(ImagesCopiedRegionCompleted 기준)

  • AMI 교차 리전 복사 실패(ImagesCopiedRegionFailed 기준)

  • AMI 교차 리전 사본 등록 취소가 완료됨(ImagesCopiedRegionDeregisterCompleted 기준)

  • AMI 교차 리전 사본 등록 취소 실패(ImagesCopiedRegionDeregisteredFailed 기준)

  • AMI 사용 중단 활성화가 완료됨(EnableImageDeprecationCompleted 기준)

  • AMI 사용 중단 활성화 실패(EnableImageDeprecationFailed 기준)

  • AMI 교차 리전 사본 사용 중단 활성화가 완료됨(EnableCopiedImageDeprecationCompleted 기준)

  • AMI 교차 리전 사본 사용 중단 활성화 실패(EnableCopiedImageDeprecationFailed 기준)

정책에 대한 CloudWatch 경보 만들기

정책에 대한 CloudWatch 지표를 모니터링하는 CloudWatch 경보를 생성할 수 있습니다. 지표가 지정한 임계값에 도달하면 CloudWatch에서 자동으로 알림을 보냅니다. CloudWatch 콘솔을 이용하여 CloudWatch 경보를 생성할 수 있습니다.

CloudWatch 콘솔을 사용하여 경보를 생성하는 방법에 대한 정보는 Amazon CloudWatch 사용 설명서에서 다음 주제를 참조하세요.

사용 사례 예시

다음은 사용 사례의 예입니다.

예제 1: ResourcesTargeted 지표

ResourcesTargeted 지표를 사용하여 특정 정책이 실행될 때마다 대상이 되는 총 리소스 수를 모니터링할 수 있습니다. 이렇게 하면 대상 리소스 수가 예상 임계값보다 작거나 초과할 때 경보를 트리거할 수 있습니다.

예를 들어 일일 정책에 따라 50 볼륨 이하의 백업을 생성할 것으로 예상하는 경우, ResourcesTargeted에 대한 sum1 시간의 기간에 대해 50보다 클 때 이메일 알림을 보내는 경보를 생성할 수 있습니다. 이렇게 하면 태그가 잘못 지정된 볼륨에서 예기치 않게 스냅샷이 생성되지 않았는지 확인할 수 있습니다.

다음 명령을 사용하여 이 경보를 생성할 수 있습니다.

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name resource-targeted-monitor \ --alarm-description "Alarm when policy targets more than 50 resources" \ --metric-name ResourcesTargeted \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 50 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

예제 2: SnapshotDeleteFailed 지표

SnapshotDeleteFailed 지표를 사용하여 정책의 스냅샷 보존 규칙에 따라 스냅샷 삭제 실패를 모니터링할 수 있습니다.

예를 들어, 스냅샷을 12시간마다 자동으로 삭제하는 정책을 작성한 경우, SnapshotDeletionFailedsum1 시간의 기간에 대해 0보다 클 때 엔지니어링 팀에 알리는 경보를 만들 수 있습니다. 이렇게 하면 부적절한 스냅샷 보존을 조사하고 불필요한 스냅샷으로 인해 스토리지 비용이 증가하지 않는지 확인하는 데 도움이 될 수 있습니다.

다음 명령을 사용하여 이 경보를 생성할 수 있습니다.

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-deletion-failed-monitor \ --alarm-description "Alarm when snapshot deletions fail" \ --metric-name SnapshotsDeleteFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

예제 3: SnapshotsCopiedRegionFailed 지표

SnapshotsCopiedRegionFailed 지표를 사용하여 정책이 스냅샷을 다른 리전으로 복사하지 못하는 시기를 식별할 수 있습니다.

예를 들어 정책이 여러 리전에 걸쳐 매일 스냅샷을 복사하는 경우, SnapshotCrossRegionCopyFailedsum1 시간의 기간에 대해 0보다 클 때 엔지니어링 팀에 SMS를 보내는 경보를 만들 수 있습니다. 이 기능은 계통의 후속 스냅샷이 정책을 통해 성공적으로 복사되었는지 확인하는 데 유용할 수 있습니다.

다음 명령을 사용하여 이 경보를 생성할 수 있습니다.

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-copy-region-failed-monitor \ --alarm-description "Alarm when snapshot copy fails" \ --metric-name SnapshotsCopiedRegionFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

실패한 작업을 보고하는 정책 관리

정책 중 하나에서 실패한 작업 지표에 대해 0이 아닌 값을 예기치 않게 보고할 경우 수행할 작업에 대한 자세한 내용은 Amazon Data Lifecycle Manager가 CloudWatch 지표에서 실패한 작업을 보고할 경우 어떻게 해야 합니까?를 참조하세요. AWS 지식 센터 문서