本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控 Amazon EC2 資源
監控是維護 Amazon EC2執行個體和 AWS 解決方案可靠性、可用性和效能的重要部分。您應該從 AWS 解決方案中的所有部分收集監控資料,以便在發生多點故障時更輕鬆地進行偵錯。
AWS 提供可用於監控 Amazon 的各種工具EC2。Amazon EC2和 CloudWatch 主控台儀表板提供 at-a-glance Amazon EC2環境狀態的檢視。此外,我們提供下列服務:
-
系統狀態檢查 – 監控使用執行個體所需的 AWS 系統,以確保正常運作。這些檢查會偵測執行個體需要 AWS 參與才能修復的問題。系統狀態檢查失敗時,您可以選擇等待 AWS 修正問題,也可以自行解決問題 (例如停止並重新啟動,或終止並取代執行個體)。導致系統狀態檢查失敗的問題範例包括:
-
網路連線中斷
-
系統電力中斷
-
實體主機的軟體問題
-
實體主機上會影響網路連線的硬體問題
如需詳細資訊,請參閱 Amazon EC2 執行個體的狀態檢查。
-
-
執行個體狀態檢查 – 監控個別執行個體的軟體和網路組態。這些檢查會偵測需要您介入修復的問題。一般來說,當執行個體狀態檢查失敗時,您需要自行處理問題 (例如重新啟動執行個體,或在作業系統中進行修改)。可能導致執行個體狀態檢查失敗的問題範例包括:
-
系統狀態檢查失敗
-
網路或啟動組態的設定不正確
-
記憶體用盡
-
檔案系統毀損
-
核心不相容
如需詳細資訊,請參閱Amazon EC2 執行個體的狀態檢查。
-
-
Amazon CloudWatch 警示 – 在您指定的期間內觀察單一指標,並根據指標在數個期間內相對於指定閾值的值執行一或多個動作。此動作是傳送至 Amazon Simple Notification Service (Amazon SNS) 主題或 Amazon EC2 Auto Scaling 政策的通知。警示只會針對持續狀態變更叫用動作。 CloudWatch alarms 不會單純因為動作處於特定狀態而叫用動作;狀態必須已變更並維持在指定的期間數。如需詳細資訊,請參閱使用監控執行個體 CloudWatch。
-
Amazon EventBridge 事件 – 自動化您的 AWS 服務並自動回應系統事件。來自 AWS 服務的事件會以 EventBridge 近乎即時的方式交付至 ,而且您可以指定當事件符合您撰寫的規則時要採取的自動動作。如需詳細資訊,請參閱使用自動 EC2 Amazon EventBridge。
-
AWS CloudTrail 日誌 – 擷取對 Amazon 進行呼叫的詳細資訊,EC2API並將其儲存為 Amazon S3 中的日誌檔案。您可以使用 CloudTrail 日誌來判斷進行哪些呼叫、呼叫的來源 IP 地址、撥打電話的人員,以及撥打電話的時間。如需詳細資訊,請參閱使用記錄 Amazon EC2 API 呼叫 AWS CloudTrail。
-
CloudWatch 代理程式 – 從EC2執行個體和內部部署伺服器上的主機和訪客收集日誌和系統層級指標。如需詳細資訊,請參閱 Amazon 使用者指南 中的使用 CloudWatch 代理程式從 Amazon EC2執行個體和內部部署伺服器收集指標和日誌。 CloudWatch