使用 Amazon CloudWatch 監控叢集資料 - Amazon EKS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon CloudWatch 監控叢集資料

Amazon CloudWatch 是一項監控服務,可從您的雲端資源收集指標和日誌。使用版本 1.28和更高版本的新叢集時, CloudWatch 提供免費的一些基本 Amazon EKS 指標。不過,使用 CloudWatch 可觀測性運算子作為 Amazon EKS 附加元件時,您可以取得增強的可觀測性功能。

Amazon CloudWatch 中的基本指標

對於新的叢集 Kubernetes 版本 1.28 和更高版本,您可以在AWS/EKS命名空間中免費取得 CloudWatch 版本指標。與下表相比,平台版本相同或更高的現有叢集也提供基本指標。

Kubernetes 版本 平台版本

1.31

eks.12

1.30

eks.20

1.29

eks.23

1.28

eks.29

下表提供支援版本可用的基本指標清單。列出的每個指標都有一分鐘的頻率。

指標名稱 描述 單位 指標維度 指標類型 來源 Kubernetes 指標

APIServerRequests

向 API 伺服器提出請求的次數。

計數

叢集名稱

流量

kube-apiserver :: apiserver_request_total

APIServerRequestsHTTP4XX

具有 API 4XX 錯誤回應的 HTTP Server 請求數目 (用戶端錯誤)。

計數

叢集名稱

錯誤

kube-apiserver :: apiserver_request_total

APIServerRequestsHTTP429

具有 API 429 錯誤回應的 HTTP Server 請求數目 (太多請求)。

計數

叢集名稱

錯誤

kube-apiserver :: apiserver_request_total

APIServerRequestsHTTP5XX

具有 API 5XX 錯誤回應的 HTTP Server 請求數目 (伺服器端錯誤)。

計數

叢集名稱

錯誤

kube-apiserver :: apiserver_request_total

APIServerRequestLatency

APIServer 回應請求所需的平均秒數。

秒鐘

叢集名稱,動詞

Latency (延遲)

kube-apiserver :: apiserver_request_duration_seconds

APIServerCurrentInflightRequests

正在主動服務的請求數量。

計數

叢集名稱、請求類型 {mutating, readOnly}

Saturation (飽和度)

kube-apiserver :: apiserver_current_inflight_requests

APIServerStorageSize

儲存資料庫的大小。

位元組

叢集名稱

Saturation (飽和度)

kube-apiserver :: apiserver_storage_size_bytes

SchedulerAttempts

排程 Pod 的嘗試次數。

計數

叢集名稱、結果 {不可排程、錯誤、排程}

Latency (延遲)

kube-scheduler :: scheduler_schedule_attempts_total

PendingPods

待排程的 Pod 數量。

計數

叢集名稱、佇列 {activeQ 不可排程、退避、gated}

Latency (延遲)

kube-scheduler :: scheduler_pending_pods

APIServerWebhookRequests

已提出的許可 Webhook 請求數目。

計數

叢集名稱、許可類型 (驗證、許可)

流量

kube-apiserver :: apiserver_admission_webhook_request_total

APIServerWebhookRejections

許可 Webhook 拒絕的數量。

計數

叢集名稱、許可類型 (驗證、許可)

錯誤

kube-apiserver :: apiserver_admission_webhook_rejection_count

APIServerWebhookLatencyP99

外部第三方許可 Webhook 的第 99 百分位數延遲。

秒鐘

叢集名稱、許可類型 (驗證、許可)

Latency (延遲)

kube-apiserver :: apiserver_admission_webhook_admission_duration_seconds

Amazon CloudWatch Observability Operator

Amazon CloudWatch Observability 會收集即時日誌、指標和追蹤資料。它將它們傳送到 Amazon CloudWatchAWS X-Ray。您可以安裝此附加元件以啟用 CloudWatch Application Signals 和 CloudWatch Container Insights Amazon EKS 的可觀測性增強。這有助於監控基礎設施和容器化應用程式的運作狀態與效能。Amazon CloudWatch 可觀測性運算子旨在安裝和設定必要的元件。

Amazon EKS 支援 CloudWatch Word 附加元件的 EKS 可觀測性運算子。附加元件允許 Container Insights 在這兩個 上 Linux 以及 Windows 叢集中的工作者節點。若要啟用 Container Insights on Windows,Amazon EKS 附加元件版本必須為 1.5.0或更新版本。目前,Amazon CloudWatch 不支援Word Application Signals EKS Windows.

以下主題說明如何開始使用 Amazon CloudWatch 叢集的 EKS 可觀測性運算子。