Visualizar e solucionar problemas detectados pelo Amazon CloudWatch Application Insights
Os tópicos desta seção fornecem informações detalhadas sobre os problemas e insights detectados que são exibidos pelo Application Insights. Eles também fornecem sugestões de resoluções para problemas detectados com sua conta ou sua configuração.
Tópicos de solução de problemas
Visão geral do console do CloudWatch
Uma visão geral dos problemas que impactam suas aplicações monitoradas podem ser encontradas no painel do CloudWatch Application Insights na página de visão geral do console do CloudWatch.
O painel de visão geral do CloudWatch Application Insights exibe o seguinte:
-
A gravidade dos problemas detectados: Alta/Média/Baixa
-
Um breve resumo do problema
-
A fonte do problema
-
A hora em que o problema começou
-
O status de resolução do problema
-
O grupo de recursos afetado
Para visualizar os detalhes de um problema específico, em Problem Summary (Resumo do problema), selecione a descrição do problema. Um painel detalhado exibe informações sobre o problema e as anomalias de métrica relacionadas, além de trechos dos erros de log. É possível fornecer feedback sobre a relevância do insight selecionando se ele é útil.
Se um recurso novo que não esteja configurado for detectado, a descrição do resumo do problema direciona você ao assistente Edit configuration (Editar configuração) para configurar o novo recurso. Se for necessário, você poderá visualizar ou editar a configuração do Grupo de recursos selecionando View/edit configuration (Visualizar/editar configuração) no canto superior direito do painel detalhado.
Para retornar à visão geral, selecione Back to overview (Voltar à visão geral), que está ao lado do cabeçalho do painel detalhado do CloudWatch Application Insights.
Página de resumo do problema do Application Insights
Página de resumo do problema do Application Insights
O CloudWatch Application Insights fornece as seguintes sobre os problemas detectados na página de resumo do problema:
-
Um breve resumo do problema
-
A data e a hora de início do problema
-
A gravidade do problema: High/Medium/Low (Alta/média/baixa)
-
O status do problema detectado: In‐progress/Resolved (Em andamento/resolvido)
-
Insights: insights gerados automaticamente sobre o problema detectado e a possível causa
-
Feedback sobre os insights: o feedback que você forneceu sobre a utilidade dos insights gerados pelo CloudWatch Application Insights
-
Observações relacionadas: uma visão detalhada das anomalias da métrica e dos trechos do erro de logs relevantes relacionados ao problema em vários componentes da aplicação
Falhas de conflito de mesclagem do agente do CloudWatch
O CloudWatch Application Insights instala e configura o agente do CloudWatch em instâncias do cliente. Isso inclui a criação de um arquivo de configuração do agente do CloudWatch com configurações para métricas ou logs. Um conflito de mesclagem poderá ocorrer se a instância do cliente já tiver um arquivo de configuração do agente do CloudWatch com configurações diferentes definidas para as mesmas métricas ou logs. Para resolver o conflito da mesclagem, use as etapas a seguir:
-
Identifique os arquivos de configuração do agente do CloudWatch em seu sistema. Para obter mais informações sobre localizações de arquivos, consulte Arquivos e locais do atendente do CloudWatch.
-
Remova as configuração de recursos que você deseja usar no Application Insights do arquivo de configuração do agente do CloudWatch existente. Se você deseja usar somente configurações do Application Insights, exclua os arquivos de configuração do agente do CloudWatch existentes.
Os alarmes não são criados
Para algumas métricas, o Application Insights prevê o limite de alarme com base nos pontos de dados anteriores da métrica. Para habilitar essa previsão, os critérios a seguir devem ser atendidos.
-
Pontos de dados recentes: deve haver no mínimo 100 pontos de dados das últimas 24 horas. Os pontos de dados não precisam ser contínuos e podem estar espalhados por todo o período de 24 horas.
-
Dados históricos: deve haver um mínimo de 100 pontos de dados abrangendo o período de 15 dias antes da data atual até 1 dia antes da data atual. Os pontos de dados não precisam ser contínuos e podem estar espalhados por todo o período de 15 dias.
nota
Para algumas métricas, o Application Insights atrasa a criação de alarmes até que as condições anteriores sejam atendidas. Nesse caso, você obtém um evento do histórico de configuração informando que a métrica não tem pontos de dados suficientes para estabelecer o limite do alarme.
Feedback
Feedback
É possível fornecer feedback sobre os insights gerados automaticamente sobre problemas detectados designando-os como úteis ou não úteis. Seu feedback sobre os insights com o diagnóstico da aplicação (anomalias da métrica e exceções de log) são usados para melhorar a futura detecção de problemas semelhantes.
Erros de configuração
O CloudWatch Application Insights usa sua configuração para criar telemetrias de monitoramento para os componentes. Quando o Application Insights detecta um problema com sua conta ou configuração, são fornecidas informações no campo Remarks (Observações) sobre como resolver o problema de configuração da sua aplicação.
A tabela a seguir mostra resoluções sugeridas para observações específicas.
Observações | Resolução sugerida | Notas adicionais |
---|---|---|
A cota para o CloudFormation já foi atingida. |
O Application Insights cria uma pilha do CloudFormation para que cada aplicação para gerencie a instalação e a configuração do atendente do CloudWatch para todos os componentes da aplicação. Por padrão, cada conta da AWS pode conter 2.000 pilhas. Consulte Limites do AWS CloudFormation. Para resolver isso, aumente o limite para pilhas do CloudFormation. |
n/a |
Não há função de instância do SSM nas instâncias a seguir. |
Para que o Application Insights consiga instalar e configurar o atendente do CloudWatch em instâncias da aplicação, as políticas AmazonSSMManagedInstanceCore e CloudWatchAgentServerPolicy devem estar anexadas à função da instância. |
O Application Insights chama a API DescribeInstanceInformation do SSM para obter a lista de instâncias com permissão do SSM. Depois que a função é anexada à instância, leva um tempo para que o SSM inclua a instância no resultado DescribeInstanceInformation. Até que o SSM inclua a instância no resultado, o erro NO_SSM_INSTANCE_ROLE permanece presente para a aplicação. |
Novos componentes podem precisar de configuração. |
O Application Insights detecta que há novos componentes no Grupo de recursos da aplicação. Para resolver isso, configure os novos componentes adequadamente. |
n/a |