本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控 AWS Systems Manager
監控是維護 和 AWS 解決方案可靠性、可用性 AWS Systems Manager 和效能的重要部分。您應該從 AWS 解決方案的所有部分收集監控資料,以便在發生多點失敗時進行偵錯。但在開始監控 Systems Manager 之前,您應該建立監控計劃來回答下列問題:
-
監控目標是什麼?
-
要監控哪些資源?
-
監控這些資源的頻率為何?
-
要使用哪些監控工具?
-
誰會執行監控任務?
-
發生問題時應該通知誰?
在您定義監控目標並建立監控計畫之後,下一步是建立您環境中的正常 Systems Manager 效能基準。您應該在不同的時間及負載條件下測量 Systems Manager 效能。當您監控 Systems Manager 時,應該存放所收集的監控資料的歷史記錄。您可以比較目前的 Systems Manager 效能資料與歷史資料,協助您辨識正常效能模式和效能異常狀況,並建立其處理方式。
例如,您可以監控作業的成功或失敗,例如「自動化」工作流程、修補基準的應用程式、維護時段事件以及組態相容性。自動化是 的功能 AWS Systems Manager。
您也可以監控受管節點的使用CPU率、磁碟 I/O 和網路使用率。當效能落於您已建立的基準之外時,您可能需要重新設定或最佳化節點,以減少CPU使用率、改善磁碟 I/O 或減少網路流量。如需監控EC2執行個體的詳細資訊,請參閱 Amazon 使用者指南 中的監控 EC2 AmazonEC2。
主題
- 監控工具
- 將節點日誌傳送至統一 CloudWatch 日誌 (CloudWatch 客服人員)
- 正在傳送 SSM Agent 日誌至 CloudWatch 日誌
- 監控您的變更請求事件
- 監控自動化
- 監控 Run Command 使用 Amazon 的指標 CloudWatch
- 使用 記錄 AWS Systems Manager API通話 AWS CloudTrail
- 使用 Logs CloudWatch 記錄自動化動作輸出
- 設定 的 Amazon CloudWatch Logs Run Command
- 使用 Amazon 監控 Systems Manager 事件 EventBridge
- 使用 Amazon SNS 通知監控 Systems Manager 狀態變更
監控工具
本章的內容提供使用可用於監控 Systems Manager 和其他 AWS 資源的工具的資訊。如需完整的工具清單,請參閱 在 中登入和監控 AWS Systems Manager。