協助改善此頁面
本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
若要提供此使用者指南,請選擇位於每個頁面右窗格的在 GitHub 上編輯此頁面連結。
本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon CloudWatch 是一種監控服務,可從雲端資源收集指標和日誌。CloudWatch 使用版本 1.28
和更新版本的新叢集時,可免費提供一些基本的 Amazon EKS 指標。不過,使用 CloudWatch 可觀測性運算子做為 Amazon EKS 附加元件時,您可以取得增強的可觀測性功能。
Amazon CloudWatch 中的基本指標
對於 Kubernetes 版本 1.28
及更高版本的叢集,您可以在 AWS/EKS
命名空間中免費取得 CloudWatch 已販賣的指標。下表提供適用於支援版本的基本指標清單。列出的每個指標的頻率為一分鐘。
指標名稱 | 描述 |
---|---|
|
排程器在指定期間內排程叢集中 Pod 的嘗試次數。此指標有助於監控排程器的工作負載,並可能指出排程壓力或 Pod 放置的潛在問題。 單位:計數 有效統計資料:總和 |
|
排程器在指定期間內將 Pod 排程到叢集中節點的成功嘗試次數。 單位:計數 有效統計資料:總和 |
|
由於有效限制,例如節點上的 CPU 或記憶體不足,在指定期間內無法排程的 Pod 嘗試次數。 單位:計數 有效統計資料:總和 |
|
由於排程器本身的內部問題,例如 API Server 連線問題,在指定期間內失敗的 Pod 嘗試次數。 單位:計數 有效統計資料:總和 |
|
叢集中排程器在指定期間內要排程的待處理 Pod 總數。 單位:計數 有效統計資料:總和 |
|
activeQ 中等待在叢集中排程一段指定期間的待處理 Pod 數量。 單位:計數 有效統計資料:總和 |
|
排程器嘗試排程和失敗的待定 Pod 數量,並維持在無法排程的狀態以供重試。 單位:計數 有效統計資料:總和 |
|
單位:計數 有效統計資料:總和 |
|
目前等待處於鎖定狀態的待定 Pod 數量,因為在符合必要條件之前無法排程。 單位:計數 有效統計資料:總和 |
|
叢集中所有 API 伺服器提出的 HTTP 請求數量。 單位:計數 有效統計資料:總和 |
|
對叢集中產生 單位:計數 有效統計資料:總和 |
|
對叢集中所有 API 伺服器提出的 HTTP 請求數量,這些請求會產生 單位:計數 有效統計資料:總和 |
|
對叢集中產生 單位:計數 有效統計資料:總和 |
|
對叢集中所有 API 伺服器提出的 單位:計數 有效統計資料:總和 |
|
從叢集中所有 API 伺服器的所有 單位:秒 有效統計資料:平均 |
|
從叢集中所有 API 伺服器的所有 單位:秒 有效統計資料:平均 |
|
從叢集中所有 API 伺服器的所有 單位:秒 有效統計資料:平均 |
|
從叢集中所有 API 伺服器的所有 單位:秒 有效統計資料:平均 |
|
從叢集中所有 API 伺服器的所有 單位:秒 有效統計資料:平均 |
|
從叢集中所有 API 伺服器的所有 單位:秒 有效統計資料:平均 |
|
叢集中所有 API 伺服器目前正在處理的變動請求數量 ( 單位:計數 有效統計資料:總和 |
|
叢集中所有 API 伺服器目前正在處理的唯讀請求 ( 單位:計數 有效統計資料:總和 |
|
叢集中所有 API 伺服器發出的許可 Webhook 請求數目。 單位:計數 有效統計資料:總和 |
|
叢集中所有 API 伺服器之間發出的變動許可 Webhook 請求數目。 單位:計數 有效統計資料:總和 |
|
驗證叢集中所有 API 伺服器發出的許可 Webhook 請求數目。 單位:計數 有效統計資料:總和 |
|
在叢集中所有 API 伺服器之間提出的許可 Webhook 請求數量已被拒絕。 單位:計數 有效統計資料:總和 |
|
在叢集中所有 API 伺服器之間發出且已拒絕的變動許可 Webhook 請求數目。 單位:計數 有效統計資料:總和 |
|
驗證叢集中所有 API 伺服器之間所提出的許可 Webhook 請求數量,已遭到拒絕。 單位:計數 有效統計資料:總和 |
|
第三方許可 Webhook 請求的第 99 個百分位數,從叢集中所有 API 伺服器的所有請求計算得出。代表低於 99% 的第三方許可 Webhook 請求完成的回應時間。 單位:秒 有效統計資料:平均 |
|
第三方變動許可 Webhook 請求的延遲第 99 個百分位數,從叢集中所有 API 伺服器的所有請求計算。代表回應時間低於 99% 的第三方變動許可 Webhook 請求完成的時間。 單位:秒 有效統計資料:平均 |
|
第三方驗證從叢集中所有 API 伺服器的所有請求計算的許可 Webhook 請求的延遲第 99 個百分位數。代表回應時間低於 99% 的所有驗證許可 Webhook 請求的第三方完成時間。 單位:秒 有效統計資料:平均 |
|
叢集中 API 伺服器所使用的已壓縮儲存資料庫檔案的實體大小,以位元組為單位。此指標代表為儲存配置的實際磁碟空間。 單位:位元組 有效統計資料:上限 |
Amazon CloudWatch 可觀測性運算子
Amazon CloudWatch Observability 會收集即時日誌、指標和追蹤資料。它會將其傳送至 Amazon CloudWatch 和 AWS X-Ray。您可以安裝此附加元件來啟用 CloudWatch Application Signals 和 CloudWatch Container Insights,搭配 Amazon EKS 的增強可觀測性。這有助於監控基礎設施和容器化應用程式的運作狀態與效能。Amazon CloudWatch Observability Operator 旨在安裝和設定必要的元件。
Amazon EKS 支援 CloudWatch 可觀測性運算子做為 Amazon EKS 附加元件。附加元件可在叢集中的 Linux 和 Windows 工作者節點上允許 Container Insights。若要在 Windows 上啟用 Container Insights,Amazon EKS 附加元件版本必須為 1.5.0
或更高版本。Amazon EKS Windows 目前不支援 CloudWatch Application Signals。
以下主題說明如何開始使用適用於 Amazon EKS 叢集的 CloudWatch Observability Operator。
-
如需安裝此附加元件的指示,請參閱《Amazon CloudWatch 使用者指南》中的使用 Amazon CloudWatch 可觀測性 EKS 附加元件安裝 CloudWatch 代理程式或 Helm Chart Amazon CloudWatch。 Amazon CloudWatch
-
如需 CloudWatch Application Signals 的詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的 Application Signals。
-
如需有關 Container Insights 的詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的使用 Container Insights。