AWS Systems Manager 中的日誌記錄和監控 - AWS Systems Manager

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS Systems Manager 中的日誌記錄和監控

監控是維護 和 AWS 解決方案的可靠性、可用性 AWS Systems Manager 和效能的重要部分。您應該從 AWS 解決方案的所有部分收集監控資料,以便在發生多點失敗時進行更多偵錯。 AWS 提供數種工具來監控您的 Systems Manager和其他資源並回應潛在事件。

AWS CloudTrail 日誌

CloudTrail 會提供由使用者、角色或 AWS 服務 在 Systems Manager 中採取之動作的記錄。您可以利用 CloudTrail 所收集的資訊來判斷向 Systems Manager 發出的請求,以及發出請求的 IP 地址、人員、時間和其他詳細資訊。如需詳細資訊,請參閱使用 記錄 AWS Systems Manager API 呼叫 AWS CloudTrail

Amazon CloudWatch 警示

使用 Amazon CloudWatch 警示,在一段時間內觀察您為 Amazon Elastic Compute Cloud (Amazon EC2) 執行個體和其他資源指定的單一指標。如果指標超過指定的閾值,則會將通知傳送至 Amazon Simple Notification Service (Amazon SNS) 主題或 AWS Auto Scaling 政策。CloudWatch 警示不會因為它們處於特定狀態而叫用動作。必須是狀態已變更並維持了所指定的時間長度,才會呼叫動作。如需詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的使用 Amazon CloudWatch 警示

Amazon CloudWatch 儀表板

CloudWatch 儀表板是 CloudWatch 主控台中可自訂的首頁,可讓您在單一檢視中監控資源,甚至是分散在不同 AWS 區域的那些資源。您可以使用 CloudWatch 儀表板來為 AWS 資源的指標和警示建立自訂檢視。如需詳細資訊,請參閱使用 Systems Manager 託管的 Amazon CloudWatch 儀表板

Amazon EventBridge

使用 Amazon EventBridge,您可以設定規則,提醒您 Systems Manager 資源中發生變更,並指示 EventBridge 根據事件的內容採取動作。EventBridge 支援各種Systems Manager工具發出的許多事件。如需詳細資訊,請參閱使用 Amazon EventBridge 監控 Systems Manager

Amazon CloudWatch Logs 和 SSM Agent 日誌

SSM Agent 會在各個節點的日誌檔寫入有關執行、排定動作、錯誤和運作狀態的資訊。您可以手動連線到節點來檢視日誌檔案。建議自動將代理程式日誌資料傳送至 CloudWatch Logs 中的日誌群組以進行分析。如需詳細資訊,請參閱 將節點日誌傳送至統一 CloudWatch Logs (CloudWatch 代理程式)檢視 SSM Agent 日誌

AWS Systems Manager 合規

您可以使用 中的工具 Compliance AWS Systems Manager,掃描受管節點機群的修補程式合規和組態不一致。您可以從多個 AWS 帳戶 和 收集和彙總資料 AWS 區域,然後深入研究不合規的特定資源。在預設情況下,合規會在 中顯示有關修補的目前合規資料Patch Manager、在 中的工具 AWS Systems Manager,以及在 中的State Manager工具關聯 AWS Systems Manager。如需詳細資訊,請參閱AWS Systems Manager合規

AWS Systems Manager Explorer

Explorer中的工具 是可自訂的操作儀表板 AWS Systems Manager,可報告 AWS 資源的相關資訊。 Explorer會顯示您 AWS 帳戶 和 之間的操作資料 (OpsData) 彙總檢視 AWS 區域。在 Explorer 中,OpsData 包含有關 EC2 執行個體、修補程式合規詳細資料和操作工作項目 (OpsItems) 的中繼資料。Explorer 提供脈絡指出 OpsItems 如何分散於業務單位或應用程式、如何隨著時間而演變趨勢,以及如何隨類別而變化。您可以在 Explorer 中群組和篩選資訊,以專注於與您相關且需要採取動作的項目。如需詳細資訊,請參閱AWS Systems Manager Explorer

AWS Systems Manager OpsCenter

OpsCenter中的工具 提供中央位置 AWS Systems Manager,讓營運工程師和 IT 專業人員可以檢視、調查和解決與 AWS 資源相關的操作工作項目 (OpsItems)。 OpsItems會跨 服務OpsCenter彙總和標準化OpsItems,同時提供每個 OpsItem、相關 和相關資源的關聯式調查資料。 OpsCenter也提供 Automation 中的執行手冊,這是 中的工具 AWS Systems Manager,可用來快速解決問題。 OpsCenter 已與 Amazon EventBridge 整合。這表示您可以建立 EventBridge 規則,為將事件發佈到 EventBridge OpsItems的任何 AWS 服務 自動建立。如需詳細資訊,請參閱AWS Systems Manager OpsCenter

Amazon Simple Notification Service

您可以設定 Amazon Simple Notification Service (Amazon SNS) 傳送有關您使用 Run Command或 Maintenance Windows、 工具傳送之命令狀態的通知 AWS Systems Manager。Amazon SNS 會協調和管理傳送和傳遞通知給已訂閱 Amazon SNS 主題的用戶端或端點。每當命令變更為新狀態或特定狀態時 (如「Failed」或「Timed Out」),您都會收到通知。當您將命令傳送至多個節點時,您都可以接收到傳送到特定節點之每個命令複本的通知。如需詳細資訊,請參閱使用 Amazon SNS 通知監控 Systems Manager 狀態變更

AWS Trusted Advisor 而且 AWS Health Dashboard

Trusted Advisor 利用從服務數十萬 AWS 客戶中學到的最佳實務。 Trusted Advisor 會檢查您的 AWS 環境,然後在有機會節省成本、改善系統可用性和效能,或協助解決安全漏洞時提出建議。所有 AWS 客戶都可以存取五個 Trusted Advisor 檢查。具有 AWS 支援 商業或企業計劃的客戶可以檢視所有 Trusted Advisor 檢查。如需詳細資訊,請參閱 AWS Trusted AdvisorAWS 支援 使用者指南AWS Health 使用者指南