Supervisión de datos de clústeres con Amazon CloudWatch - Amazon EKS

Supervisión de datos de clústeres con Amazon CloudWatch

Amazon CloudWatch es un servicio de supervisión que recopila métricas y registros de los recursos en la nube. CloudWatch proporciona algunas métricas básicas de Amazon EKS de forma gratuita cuando se utiliza un clúster nuevo de la versión 1.28 o superior. Sin embargo, al utilizar el operador de observabilidad de CloudWatch como complemento de Amazon EKS, se obtienen características de observabilidad mejoradas.

Métricas básicas en Amazon CloudWatch

En el caso de clústeres nuevos que sean Kubernetes versión 1.28 y superiores, obtendrá métricas CloudWatch suministradas de forma gratuita en el espacio de nombres de AWS/EKS. Las métricas básicas también se encuentran disponibles para los clústeres existentes que tengan una versión de plataforma igual o posterior en comparación con la tabla siguiente.

Versión de Kubernetes Versión de la plataforma

1.31

eks.12

1.30

eks.20

1.29

eks.23

1.28

eks.29

En la siguiente tabla se presenta una lista de las métricas básicas disponibles para las versiones compatibles. Cada métrica que aparece en la lista tiene una frecuencia de un minuto.

Nombre de métrica Descripción Unidad Dimensión métrica Tipo de métrica Métrica de Kubernetes de origen

APIServerRequests

La cantidad de veces que se realizaron solicitudes al servidor de la API.

Recuento

Nombre del clúster

Tráfico

kube-apiserver :: apiserver_request_total

APIServerRequestsHTTP4XX

La cantidad de solicitudes del servidor de la API que tuvieron una respuesta de error HTTP 4XX (error del lado del cliente).

Recuento

Nombre del clúster

Error

kube-apiserver :: apiserver_request_total

APIServerRequestsHTTP429

La cantidad de solicitudes del servidor de la API que tuvieron una respuesta de error HTTP 429 (demasiadas solicitudes).

Recuento

Nombre del clúster

Error

kube-apiserver :: apiserver_request_total

APIServerRequestsHTTP5XX

La cantidad de solicitudes del servidor de la API que tuvieron una respuesta de error HTTP 5XX (error del lado del servidor).

Recuento

Nombre del clúster

Error

kube-apiserver :: apiserver_request_total

APIServerRequestLatency

La cantidad media de segundos que tarda APIServer en responder a las solicitudes.

Segundos

Nombre del clúster, verbo

Latencia

kube-apiserver :: apiserver_request_duration_seconds

APIServerCurrentInflightRequests

La cantidad de solicitudes que se atienden activamente.

Recuento

Nombre del clúster, tipo de solicitud {mutating, readOnly}

Saturation

kube-apiserver :: apiserver_current_inflight_requests

APIServerStorageSize

El tamaño de la base de datos de almacenamiento.

Bytes

Nombre del clúster

Saturation

kube-apiserver :: apiserver_storage_size_bytes

SchedulerAttempts

Cantidad de intentos para programar pods.

Recuento

Nombre del clúster, resultado {unschedulable, error, scheduled}

Latencia

kube-scheduler :: scheduler_schedule_attempts_total

PendingPods

La cantidad de pods que están pendientes de programar.

Recuento

Nombre del clúster, cola {activeQ unschedulable, backoff, gated}

Latencia

kube-scheduler :: scheduler_pending_pods

APIServerWebhookRequests

La cantidad de solicitudes de webhook de admisión realizadas.

Recuento

Nombre del clúster, tipo de admisión (validar, admitir)

Tráfico

kube-apiserver :: apiserver_admission_webhook_request_total

APIServerWebhookRejections

La cantidad de rechazos de webhook de admisión.

Recuento

Nombre del clúster, tipo de admisión (validar, admitir)

Error

kube-apiserver :: apiserver_admission_webhook_rejection_count

APIServerWebhookLatencyP99

El percentil 99 de latencia de los webhooks de admisión externos de terceros.

Segundos

Nombre del clúster, tipo de admisión (validar, admitir)

Latencia

kube-apiserver :: apiserver_admission_webhook_admission_duration_seconds

Amazon CloudWatch Observability Operator

Amazon CloudWatch Observability recopila registros, métricas y datos de rastreo en tiempo real. Los envía a Amazon CloudWatch y AWS X-Ray. Puede instalar este complemento para habilitar tanto CloudWatch Application Signals como Container Insights de CloudWatch con una observabilidad mejorada para Amazon EKS. Esto le ayuda a monitorear el estado y el rendimiento de su infraestructura y aplicaciones en contenedores. El operador de observabilidad de Amazon CloudWatch está diseñado para instalar y configurar los componentes necesarios.

Amazon EKS admite el operador de observabilidad de CloudWatch como complemento de Amazon EKS. El complemento Container Insights también admite Linux en nodos de trabajo de Windows en el clúster. Para activar Container Insights en Windows, la versión del complemento de Amazon EKS debe ser 1.5.0 o superior. Actualmente, CloudWatch Application Signals no es compatible con Amazon EKS en Windows.

Los siguientes temas describen cómo comenzar a utilizar el operador de observabilidad de CloudWatch para el clúster de Amazon EKS.