本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控 Amazon EC2 資源
監控是維護 Amazon EC2 執行個體和 AWS 解決方案可靠性、可用性和效能的重要部分。您應該從 AWS 解決方案的所有部分收集監控資料,以便在發生多點故障時更輕鬆地偵錯。
AWS 提供各種可用來監控 Amazon EC2 的工具。Amazon EC2 和 CloudWatch 主控台儀表板可提供 Amazon EC2 環境狀態的快速瀏覽檢視。此外,我們提供下列項目:
-
系統狀態檢查 – 監控使用執行個體所需的 AWS 系統,以確保其正常運作。這些檢查會偵測您的執行個體需要 AWS 參與才能修復的問題。系統狀態檢查失敗時,您可以選擇等待 AWS 修正問題,也可以自行解決問題 (例如停止並重新啟動,或終止並取代執行個體)。導致系統狀態檢查失敗的問題範例包括:
-
網路連線中斷
-
系統電力中斷
-
實體主機的軟體問題
-
實體主機上會影響網路連線的硬體問題
如需詳細資訊,請參閱 Amazon EC2 執行個體的狀態檢查。
-
-
執行個體狀態檢查 – 監控個別執行個體的軟體和網路組態。這些檢查會偵測需要您介入修復的問題。一般來說,當執行個體狀態檢查失敗時,您需要自行處理問題 (例如重新啟動執行個體,或在作業系統中進行修改)。可能導致執行個體狀態檢查失敗的問題範例包括:
-
系統狀態檢查失敗
-
網路或啟動組態的設定不正確
-
記憶體用盡
-
檔案系統毀損
-
核心不相容
如需詳細資訊,請參閱 Amazon EC2 執行個體的狀態檢查。
-
-
Amazon CloudWatch 警示 – 監看指定時段內的單一指標,並根據與多個時段內給定之閾值相對的指標值來執行一或多個動作。此動作是傳送到 Amazon Simple Notification Service (Amazon SNS) 主題或 Amazon EC2 Auto Scaling 政策的通知。警示僅會針對持續狀態變更呼叫動作。CloudWatch 警示不會只因處於特定狀態就叫用動作,狀態必須已變更並已維持一段指定的時間。如需詳細資訊,請參閱使用 CloudWatch 監控您的執行個體。
-
Amazon EventBridge 事件 – 自動化您的 AWS 服務並自動回應系統事件。來自 AWS 服務的事件會以近乎即時的方式交付至 EventBridge,而且您可以指定當事件符合您撰寫的規則時要採取的自動動作。如需詳細資訊,請參閱使用 EventBridge 自動化 Amazon EC2。
-
AWS CloudTrail 日誌 – 擷取對 Amazon EC2 API 進行呼叫的詳細資訊,並將其儲存為 Amazon S3 中的日誌檔案。您可以使用這些 CloudTrail 日誌來判斷提出了哪些呼叫、提出呼叫的來源 IP 位址、提出呼叫的人員及時間等。如需詳細資訊,請參閱使用 AWS CloudTrail 記錄 Amazon EC2 API 呼叫。。
-
CloudWatch 代理程式 – 會從 EC2 執行個體和內部部署伺服器上的主機和訪客收集記錄和系統層級度量。如需詳細資訊,請參閱 「Amazon CloudWatch 使用者指南」 中的使用 CloudWatch 代理程式從 Amazon EC2 執行個體和現場部署伺服器收集指標和日誌。