View a markdown version of this page

監控 Amazon ECS 受管執行個體 - Amazon Elastic Container Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控 Amazon ECS 受管執行個體

監控是維護 Amazon ECS 受管執行個體工作負載可靠性、可用性和效能的重要部分。 AWS 提供多種工具和服務,可協助您監控容器化應用程式和基礎設施。

Container Insights 監控

CloudWatch Container Insights 能夠為容器化應用程式與微服務提供全面的監控。Container Insights 會自動收集、彙總及總結來自執行於 Amazon ECS 受管理執行個體上的容器化應用程式與微服務的指標及日志。

Container Insights 會於叢集、服務及任務層級收集指標,提供以下面向的可見性:

  • CPU 與記憶體使用率

  • 網路效能指標

  • 儲存使用率

  • 任務與服務效能

這些指標顯示在 CloudWatch 儀表板中,可用於建立警示,實現效能問題自動回應。Container Insights 還提供增強的監控功能,可協助您快速識別問題並進行疑難排解。

注意

Container Insights 需額外付費才可使用。如需有關定價的詳細資訊,請參閱 Amazon CloudWatch 定價

GPU 監控

對於執行支援 NVIDIA GPU 的 Amazon EC2 執行個體類型的 Amazon ECS 受管執行個體,具有增強可觀測性的 Container Insights 會從容器、任務和執行個體層級的 NVIDIA Data Center GPU Manager (DCGM) 收集 GPU 指標。不會使用基本 Container Insights 收集 GPU 指標;啟用增強型可觀測性來存取 GPU 遙測。

不需要安裝其他代理程式。在叢集上啟用具有增強可觀測性的 Container Insights 時,會在支援的執行個體類型上自動收集 GPU 指標。

如需 GPU 指標和維度的清單,請參閱具有增強型可觀測性指標的 Amazon ECS Container Insights

執行個體監控

若要監控支援 Amazon ECS 受管執行個體工作負載的基礎基礎設施,您可以使用 CloudWatch 提供的 Amazon EC2 指標。

Amazon ECS 受管執行個體隨附兩個 Amazon EBS 磁碟區:

  • 用於作業系統檔案系統的根磁碟區

  • 應用程式使用的資料磁碟區

啟用 Container Insights 時,Amazon ECS 會自動發佈執行個體層級作業系統和資料檔案系統使用率指標。

Amazon ECS 受管執行個體的可用指標包括:

注意

CloudWatch 代理程式無法做為協助程式執行,因為 Amazon ECS 受管執行個體上不支援協助程式。這表示無法使用其他需要以協助程式身分執行之 CloudWatch 代理程式的系統層級指標。

這些指標會自動提供,無需手動安裝代理程式。

Amazon ECS 受管執行個體的詳細監控

CloudWatch 提供兩種類別的監控:基本監控詳細監控。依預設,受管執行個體會設定為基本監控。您可以選擇啟用詳細監控,以協助您更快地識別和處理操作問題。在建立或更新 Amazon ECS 受管執行個體容量提供者時,您可以啟用或停用詳細監控。

在受管執行個體上啟用詳細監控,不會影響所連接 Amazon EBS 磁碟區的監控。

下表重點說明了受管執行個體的基本監控與詳細監控之間的差異。

監控類型 描述 費用
基本監控

狀態檢查指標在 1 分鐘內可用。所有其他指標均在 5 分鐘內可用。

免費。
詳細監控 所有指標 (包括狀態檢查指標) 在 1 分鐘內可用。若要取得此層級的資料,必須專門為受管執行個體啟用該類型。對於已啟用詳細監控的受管執行個體,您亦可取得類似受管執行個體的跨群組彙總資料。 我們會按 Amazon ECS 受管執行個體傳送至 CloudWatch 的指標進行計費。您不需為資料儲存付費。如需詳細資訊,請參閱 Amazon CloudWatch 定價頁面上的付費方案範例 1 - EC2 詳細監控

所需的許可

若要啟用受管執行個體的詳細監控,使用者必須具有使用 MonitorInstances API 動作的許可。若要關閉受管執行個體的詳細監控,使用者必須具有使用 UnmonitorInstances API 動作的許可。