Ajudar a melhorar esta página
Para contribuir com este guia de usuário, escolha o link Editar esta página no GitHub, disponível no painel direito de cada página.
Monitorar dados de cluster com o Amazon CloudWatch
O Amazon CloudWatch é um serviço de monitoramento que coleta métricas e logs dos seus recursos na nuvem. O CloudWatch fornece algumas métricas básicas do Amazon EKS gratuitamente ao usar um novo cluster na versão 1.28
ou superior. No entanto, ao usar o CloudWatch Observability Operator como um complemento do Amazon EKS, você pode obter recursos aprimorados de observabilidade.
Métricas básicas no Amazon CloudWatch
Se o cluster estiver na versão 1.28
ou mais recente do Kubernetes, as métricas fornecidas do CloudWatch serão disponibilizadas gratuitamente no namespace do AWS/EKS
. A tabela a seguir fornece uma lista das métricas básicas que estão disponíveis para as versões com suporte. Cada métrica listada tem um padrão de um minuto.
Nome da métrica | Descrição |
---|---|
|
O número total de tentativas do agendador para agendar pods no cluster para um determinado período. Essa métrica ajuda a monitorar a workload do agendador e pode indicar a pressão do agendamento ou possíveis problemas com o posicionamento do pod. Unidades: contagem Estatísticas válidas: soma |
|
O número de tentativas com êxito do agendador em agendar pods em nós no cluster por um determinado período. Unidades: contagem Estatísticas válidas: soma |
|
O número de tentativas em agendar pods que não puderam ser agendados por um determinado período devido a restrições válidas, como CPU ou memória insuficientes em um nó. Unidades: contagem Estatísticas válidas: soma |
|
O número de tentativas de agendar pods que falharam em um determinado período devido a um problema interno com o próprio agendador, como problemas de conectividade do servidor de API. Unidades: contagem Estatísticas válidas: soma |
|
O número total de pods pendentes a serem agendados pelo agendador no cluster em um determinado período. Unidades: contagem Estatísticas válidas: soma |
|
O número de pods pendentes na activeQ, que estão aguardando para serem agendados no cluster por um determinado período. Unidades: contagem Estatísticas válidas: soma |
|
O número de pods pendentes que o agendador tentou agendar e falhou, e que estão mantidos em um estado não agendável para nova tentativa. Unidades: contagem Estatísticas válidas: soma |
|
O número de pods pendentes em Unidades: contagem Estatísticas válidas: soma |
|
O número de pods pendentes que estão atualmente aguardando em um estado fechado, pois não podem ser agendados até que atendam às condições exigidas. Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações HTTP feitas em todos os servidores de API no cluster. Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações HTTP feitas a todos os servidores de API no cluster que resultaram em códigos de status Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações HTTP feitas a todos os servidores de API no cluster que resultaram no código de status Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações HTTP feitas a todos os servidores de API no cluster que resultaram em códigos de status Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações de pods Unidades: contagem Estatísticas válidas: soma |
|
O 99.º percentil de latência para solicitações Unidades: segundos Estatística válida: média |
|
O 99.º percentil de latência para solicitações Unidades: segundos Estatística válida: média |
|
O 99.º percentil de latência para solicitações Unidades: segundos Estatística válida: média |
|
O 99.º percentil de latência para solicitações Unidades: segundos Estatística válida: média |
|
O 99.º percentil de latência para solicitações Unidades: segundos Estatística válida: média |
|
O 99.º percentil de latência para solicitações Unidades: segundos Estatística válida: média |
|
O número de solicitações mutantes ( Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações somente leitura ( Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações de webhook de admissão feitas em todos os servidores de API no cluster. Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações mutantes de webhook de admissão feitas em todos os servidores de API no cluster. Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações de validação de webhook de admissão feitas em todos os servidores de API no cluster. Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações de webhook de admissão feitas em todos os servidores de API no cluster que foram rejeitadas. Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações mutantes de webhook de admissão feitas em todos os servidores de API no cluster que foram rejeitadas. Unidades: contagem Estatísticas válidas: soma |
|
O número de solicitações de validação de webhook de admissão feitas em todos os servidores de API no cluster que foram rejeitadas. Unidades: contagem Estatísticas válidas: soma |
|
O 99.º percentil de latência para solicitações de webhook de admissão de terceiros calculado com base em todas as solicitações em todos os servidores de API no cluster. Representa o tempo de resposta abaixo do qual 99% de todas as solicitações de webhook de admissão de terceiros são concluídas. Unidades: segundos Estatística válida: média |
|
O 99.º percentil de latência para solicitações mutantes de webhook de admissão de terceiros calculado com base em todas as solicitações em todos os servidores de API no cluster. Representa o tempo de resposta abaixo do qual 99% de todas as solicitações mutantes de webhook de admissão de terceiros são concluídas. Unidades: segundos Estatística válida: média |
|
O 99.º percentil de latência para solicitações de validação de webhook de admissão de terceiros calculado com base em todas as solicitações em todos os servidores de API no cluster. Representa o tempo de resposta abaixo do qual 99% de todas as solicitações de validação de webhook de admissão de terceiros são concluídas. Unidades: segundos Estatística válida: média |
|
O tamanho físico em bytes do arquivo de banco de dados de armazenamento etcd usado pelos servidores de API no cluster. Essa métrica representa o espaço em disco real alocado para o armazenamento. Unidades: bytes Estatísticas válidas: máximo |
Amazon CloudWatch Observability Operator
O Amazon CloudWatch Observability coleta logs, métricas e dados de rastreamento em tempo real. Ele os envia para o Amazon CloudWatch e para o AWS X-Ray. É possível instalar este complemento para habilitar o CloudWatch Application Signals e o CloudWatch Container Insights com observabilidade aprimorada para o Amazon EKS. Isso ajuda você a monitorar a integridade e o desempenho da infraestrutura e de aplicações conteinerizadas. O Amazon CloudWatch Observability Operator foi desenvolvido para instalar e configurar os componentes necessários.
O Amazon EKS oferece suporte ao Amazon CloudWatch Observability Operator como um complemento do Amazon EKS. O complemento possibilita o uso do Container Insights em nós de processamento do Linux e do Windows no cluster. Para ativar o Container Insights no Windows, a versão do complemento do Amazon EKS deve ser 1.5.0
ou superior. No momento, o CloudWatch Application Signals não é compatível com o Windows para Amazon EKS.
Os tópicos abaixo descrevem como começar a utilizar o CloudWatch Observability Operator para o seu cluster do Amazon EKS.
-
Para obter instruções sobre como instalar esse complemento, consulte Instalar o CloudWatch Agent com o complemento do EKS do Amazon CloudWatch Observability ou o chart do Help no Guia do usuário do Amazon CloudWatch.
-
Para obter mais informações sobre os CloudWatch Application Signals, consulte Application Signals no Guia do usuário do Amazon CloudWatch.
-
Para obter mais informações sobre o Container Insights, consulte Usar o Container Insights no Manual do usuário do Amazon CloudWatch.