AWS FIS falhas de experimentos ao testar pods do Kubernetes em execução em seus clusters do Amazon Elastic Kubernetes Service - AWS Hub de resiliência

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

AWS FIS falhas de experimentos ao testar pods do Kubernetes em execução em seus clusters do Amazon Elastic Kubernetes Service

A seguir estão as falhas comuns do Amazon Elastic Kubernetes Service (EKSAmazon) encontradas ao testar pods do Kubernetes em execução em seus clusters da Amazon: EKS

  • Configuração incorreta de IAM funções para AWS FIS experimentos ou para a conta de serviço do Kubernetes.

    • Mensagens de falha:

      • Error resolving targets. Kubernetes API returned ApiException with error code 401.

      • Error resolving targets. Kubernetes API returned ApiException with error code 403.

      • Unable to inject AWS FIS Pod: Kubernetes API returned status code 403. Check Amazon EKS logs for more details.

    • Correção: verifique o seguinte.

      • Certifique-se de ter seguido as instruções em Usar as ações do AWS FISaws:eks:pod.

      • Certifique-se de ter criado e configurado uma conta de serviço do Kubernetes com as RBAC permissões necessárias e o namespace correto.

      • Certifique-se de ter mapeado a IAM função fornecida (veja a saída da AWS CloudFormation pilha do teste) para o usuário do Kubernetes.

  • Não foi possível iniciar o AWS FIS Pod: atingiu o máximo de contêineres secundários com falha. Isso geralmente acontece quando a memória não é suficiente para executar o AWS FIS contêiner auxiliar.

    • Mensagem de falha: Unable to heartbeat FIS Pod: Max failed sidecar containers reached

    • Correção: uma opção para evitar esse erro é reduzir a porcentagem de carga alvo a ser alinhada com a memória disponível ou. CPU

  • A afirmação do alarme falhou no início do experimento. Esse erro ocorre porque o alarme relacionado não tem ponto de dados.

    • Mensagem de falha: Assertion failed for the following alarms Lista todos os alarmes para os quais a afirmação falhou.

    • Correção: certifique-se que o Container Insights esteja instalado corretamente para os alarmes e que o alarme não esteja ligado (no estado ALARM).