使用 監控 Data Lifecycle Manager 政策 CloudWatch - Amazon EBS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 監控 Data Lifecycle Manager 政策 CloudWatch

您可以使用 監控 Amazon Data Lifecycle Manager 生命週期政策 CloudWatch,該政策會收集原始資料並將其處理為可讀取的近乎即時的指標。您可以使用這些指標來查看政策隨時間AMIs建立、刪除和複製的 Amazon EBS快照和 EBS後端的確切數量。您也可以設定留意特定閾值的警示,當滿足這些閾值時傳送通知或採取動作。

指標會保存 15 個月的時間,以便您存取歷史資訊,更清楚地了解生命週期政策在長時間內的執行效能。

如需 Amazon 的詳細資訊 CloudWatch,請參閱 Amazon CloudWatch 使用者指南

支援的指標

Data Lifecycle Manager 命名空間包含下列 Amazon Data Lifecycle Manager 生命週期政策的指標。支援的指標會因政策類型而有所不同。

所有指標都可以在 DLMPolicyId 維度上測量。最實用的統計資訊是 sumaverage,測量單位為 count

選擇索引標籤即可檢視該政策類型支援的指標。

EBS snapshot policies
指標 描述

ResourcesTargeted

快照或 EBS後端AMI政策中指定標籤的目標資源數目。

SnapshotsCreateStarted

快照政策啟動的快照建立動作數量。每個動作只會記錄一次,即使後續有多次重試也是如此。

如果快照建立動作失敗,Amazon Data Lifecycle Manager 會傳送 SnapshotsCreateFailed 指標。

SnapshotsCreateCompleted

快照政策建立的快照數量。這包括排定時間 60 分鐘內的成功重試次數。

SnapshotsCreateFailed

快照政策無法建立的快照數量。這包括從排定時間起 60 分鐘內失敗的重試次數。

SnapshotsSharedCompleted

快照政策跨帳戶共用的快照數量。

SnapshotsDeleteCompleted

快照或 EBS後端AMI政策刪除的快照數目。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包含當 EBS後端AMI政策取消註冊 時刪除的快照AMIs。

SnapshotsDeleteFailed

快照或 EBS後端AMI政策無法刪除的快照數目。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包含當 EBS後端AMI政策取消註冊 時刪除的快照AMIs。

SnapshotsCopiedRegionStarted

快照政策啟動的跨區域快照複製動作數量。

SnapshotsCopiedRegionCompleted

快照政策建立的跨區域快照複本數量。這包括排定時間的 24 小時內成功的重試次數。

SnapshotsCopiedRegionFailed

快照政策無法建立的跨區域快照複本數量。這包括從排定時間起 24 小時內失敗的重試次數。

SnapshotsCopiedRegionDeleteCompleted

快照政策所刪除的跨區域快照複本數量 (如保留規則所指定)。

SnapshotsCopiedRegionDeleteFailed

快照政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

snapshotsArchiveDeletionFailed

快照政策無法從封存層刪除的封存快照數量。

snapshotsArchiveScheduled

快照政策排定封存的快照數量。

snapshotsArchiveCompleted

快照政策成功封存的快照數量。

snapshotsArchiveFailed

快照政策無法封存的快照數量。

snapshotsArchiveDeletionCompleted

快照政策成功從封存層刪除的封存快照數量。

PreScriptStarted

成功起始前置指令碼的執行個體數。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PreScriptCompleted

成功完成前置指令碼的執行個體數。即使前置指令碼在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PreScriptFailed

無法成功完成前置指令碼的執行個體數。即使前置指令碼在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PostScriptStarted

成功啟動後置指令碼的執行個體數。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PostScriptCompleted

成功完成後置指令碼的執行個體數。即使後置指令碼在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PostScriptFailed

無法成功完成後置指令碼的執行個體數。即使後置指令碼在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

VSSBackupStarted

成功啟動VSS備份的執行個體數目。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

VSSBackupCompleted

成功完成VSS備份的執行個體數目。即使VSS備份在逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

VSSBackupFailed

備份VSS無法成功完成的執行個體數目。即使VSS備份在逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

EBS-backed AMI policies

下列指標可與 EBS後端AMI政策搭配使用:

指標 描述

ResourcesTargeted

快照或 EBS後端AMI政策中指定標籤的目標資源數目。

SnapshotsDeleteCompleted

快照或 EBS後端AMI政策刪除的快照數目。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包含當 EBS後端AMI政策取消註冊 時刪除的快照AMIs。

SnapshotsDeleteFailed

快照或 EBS後端AMI政策無法刪除的快照數目。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包含當 EBS後端AMI政策取消註冊 時刪除的快照AMIs。

SnapshotsCopiedRegionDeleteCompleted

快照政策所刪除的跨區域快照複本數量 (如保留規則所指定)。

SnapshotsCopiedRegionDeleteFailed

快照政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

ImagesCreateStarted

由 EBS後端AMI政策啟動CreateImage的動作數目。

ImagesCreateCompleted

EBS由 後端AMI政策AMIs建立的 數目。

ImagesCreateFailed

AMIs 無法由 EBS後端AMI政策建立的 數目。

ImagesDeregisterCompleted

由 EBS後端AMI政策AMIs取消註冊的 數目。

ImagesDeregisterFailed

無法由 EBS後端AMI政策取消註冊AMIs的 數目。

ImagesCopiedRegionStarted

由 EBS後端AMI政策啟動的跨區域複製動作數目。

ImagesCopiedRegionCompleted

EBS由 後端AMI政策建立的跨區域AMI複本數目。

ImagesCopiedRegionFailed

無法由 EBS後端AMI政策建立的跨區域AMI複本數目。

ImagesCopiedRegionDeregisterCompleted

依保留規則指定,由 EBS後端AMI政策取消註冊的跨區域AMI複本數目。

ImagesCopiedRegionDeregisteredFailed

無法取消註冊的跨區域AMI複本數量,如 保留規則所指定,由 EBS後端AMI政策所指定。

EnableImageDeprecationCompleted

AMIs 被 EBS後端AMI政策標記為取代的 數目。

EnableImageDeprecationFailed

AMIs 無法由 EBS後端AMI政策標示為取代的 數目。

EnableCopiedImageDeprecationCompleted

被 EBS後端AMI政策標記為取代的跨區域AMI複本數目。

EnableCopiedImageDeprecationFailed

無法由 EBS後端AMI政策標示為取代的跨區域AMI複本數目。

Cross-account copy event policies

下列指標可以與跨帳戶複製事件政策搭配使用:

指標 描述

SnapshotsCopiedAccountStarted

跨帳戶複製事件政策啟動的跨帳戶快照複製動作數量。

SnapshotsCopiedAccountCompleted

跨帳戶複製事件政策從另一個帳戶複製的快照數量。這包括排定時間的 24 小時內成功的重試次數。

SnapshotsCopiedAccountFailed

跨帳戶複製事件政策無法從另一個帳戶複製的快照數量。這包括排定時間的 24 小時內失敗的重試次數。

SnapshotsCopiedAccountDeleteCompleted

跨帳戶複製事件政策所刪除的跨區域快照複本數量 (由保留規則所指定)。

SnapshotsCopiedAccountDeleteFailed

跨帳戶複製事件政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

檢視政策的 CloudWatch 指標

您可以使用 AWS Management Console 或 命令列工具來列出 Amazon Data Lifecycle Manager 傳送至 Amazon 的指標 CloudWatch。

Amazon EC2 console
使用 Amazon EC2主控台檢視指標
  1. 在 開啟 Amazon EC2主控台https://console.aws.amazon.com/ec2/

  2. 在導覽窗格中,選擇 Lifecycle Manager (生命週期管理器)。

  3. 在網格中選取政策,然後選取 Monitoring (監控) 索引標籤。

CloudWatch console
使用 Amazon CloudWatch 主控台檢視指標
  1. 在 開啟 CloudWatch 主控台https://console.aws.amazon.com/cloudwatch/

  2. 在導覽窗格中,選擇 指標

  3. 選取EBS命名空間,然後選取 Data Lifecycle Manager 指標

AWS CLI
列出 Amazon Data Lifecycle Manager 的所有可用指標

使用 list-metrics 命令。

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS
列出特定政策的所有指標

使用 list-metrics 命令並指定 DLMPolicyId 維度。

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS \ --dimensions Name=DLMPolicyId,Value=policy-abcdef01234567890
列出所有政策的單一指標

使用 list-metrics 命令並指定 --metric-name 選項。

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS \ --metric-name SnapshotsCreateCompleted

政策的圖形指標

建立政策後,您可以開啟 Amazon EC2主控台,並在監控索引標籤上檢視政策的監控圖表。每個圖形都是以其中一個可用的 Amazon EC2指標為基礎。

下列圖表指標可供使用:

  • 目標資源 (基於 ResourcesTargeted)

  • 快照建立已開始 (基於 SnapshotsCreateStarted)

  • 快照建立已完成 (基於 SnapshotsCreateCompleted)

  • 快照建立失敗 (基於 SnapshotsCreateFailed)

  • 快照共用已完成 (基於 SnapshotsSharedCompleted)

  • 快照刪除已完成 (基於 SnapshotsDeleteCompleted)

  • 快照刪除失敗 (基於 SnapshotsDeleteFailed)

  • 快照跨區域複製已開始 (基於 SnapshotsCopiedRegionStarted)

  • 快照跨區域複製已完成 (基於 SnapshotsCopiedRegionCompleted)

  • 快照跨區域複製失敗 (基於 SnapshotsCopiedRegionFailed)

  • 快照跨區域複本刪除已完成 (基於 SnapshotsCopiedRegionDeleteCompleted)

  • 快照跨區域複本刪除失敗 (基於 SnapshotsCopiedRegionDeleteFailed)

  • 快照跨帳戶複製已開始 (基於 SnapshotsCopiedAccountStarted)

  • 快照跨帳戶複製已完成 (基於 SnapshotsCopiedAccountCompleted)

  • 快照跨帳戶複製失敗 (基於 SnapshotsCopiedAccountFailed)

  • 快照跨帳戶複本刪除已完成 (基於 SnapshotsCopiedAccountDeleteCompleted)

  • 快照跨帳戶複本刪除失敗 (基於 SnapshotsCopiedAccountDeleteFailed)

  • AMI 建立已開始 (根據 ImagesCreateStarted

  • AMI 已完成建立 (根據 ImagesCreateCompleted

  • AMI 建立失敗 (根據 ImagesCreateFailed

  • AMI 已完成取消註冊 (根據 ImagesDeregisterCompleted

  • AMI 取消註冊失敗 (根據 ImagesDeregisterFailed

  • AMI 跨區域複製已啟動 (以 為基礎ImagesCopiedRegionStarted

  • AMI 已完成跨區域複製 (以 為基礎ImagesCopiedRegionCompleted

  • AMI 跨區域複製失敗 (以 為基礎ImagesCopiedRegionFailed

  • AMI 已完成跨區域複製取消註冊 (以 為基礎ImagesCopiedRegionDeregisterCompleted

  • AMI 跨區域複製取消註冊失敗 (以 為基礎ImagesCopiedRegionDeregisteredFailed

  • AMI 啟用取代完成 (以 為基礎EnableImageDeprecationCompleted

  • AMI 啟用取代失敗 (以 為基礎EnableImageDeprecationFailed

  • AMI 跨區域複製啟用取代已完成 (以 為基礎EnableCopiedImageDeprecationCompleted

  • AMI 跨區域複製啟用取代失敗 (以 為基礎EnableCopiedImageDeprecationFailed

建立政策的 CloudWatch 警示

您可以建立 CloudWatch 警示來監控政策的 CloudWatch 指標。當指標達到您指定的閾值時, CloudWatch 會自動傳送通知給您。您可以使用 CloudWatch 主控台建立 CloudWatch 警示。

如需使用 CloudWatch 主控台建立警示的詳細資訊,請參閱 Amazon CloudWatch 使用者指南 中的下列主題。

範例使用案例

以下是使用案例的範例。

範例 1: ResourcesTargeted 指標

您可以使用 ResourcesTargeted 指標,來監控某個特定政策每次執行時鎖定的資源總數。這可讓您在目標資源數量低於或高於預期閾值時觸發警示。

例如,如果您希望每日政策建立不超過 50 個磁碟區的備份,您可以建立警示,當在 1 小時的期間內 ResourcesTargetedsum 大於 50 時傳送電子郵件通知。如此一來,您可以確保沒有快照會從錯誤標記的磁碟區中意外建立。

您可以使用下列命令來建立警示:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name resource-targeted-monitor \ --alarm-description "Alarm when policy targets more than 50 resources" \ --metric-name ResourcesTargeted \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 50 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

範例 2: SnapshotDeleteFailed 指標

您可以使用 SnapshotDeleteFailed 指標來監控是否有失敗,以根據政策的快照保留規則來刪除快照。

例如,如果您建立的政策應該每十二小時自動刪除快照,您可以建立警示,當在 1 小時的期間內 SnapshotDeletionFailedsum 大於 0 時通知工程團隊。這有助於調查不當的快照保留,並確保不必要的快照不會增加您的儲存成本。

您可以使用下列命令來建立警示:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-deletion-failed-monitor \ --alarm-description "Alarm when snapshot deletions fail" \ --metric-name SnapshotsDeleteFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

範例 3: SnapshotsCopiedRegionFailed 指標

使用 SnapshotsCopiedRegionFailed 指標,來識別政策無法將快照複製到其他區域的時間。

例如,如果您的政策每天跨 區域複製快照,您可以建立警示,當 sumSnapshotCrossRegionCopyFailed超過01一小時時SMS,將 傳送給您的工程團隊。這對於確認政策是否已成功複製歷程中的後續快照相當實用。

您可以使用下列命令來建立警示:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-copy-region-failed-monitor \ --alarm-description "Alarm when snapshot copy fails" \ --metric-name SnapshotsCopiedRegionFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

管理報告失敗動作的政策

如需某個政策針對失敗的動作指標報告非預期的非零值時該怎麼做的詳細資訊,請參閱如果 Amazon Data Lifecycle Manager 在 CloudWatch 指標中報告失敗的動作,該怎麼辦? AWS 知識中心文章。