OPS04-BP02 Implementar a telemetria de aplicações
A telemetria de aplicações serve como base para a observabilidade da workload. É fundamental emitir uma telemetria que ofereça informações práticas sobre o estado da sua aplicação e a obtenção de resultados técnicos e comerciais. Da solução de problemas à medição do impacto de um novo recurso ou à garantia do alinhamento com os indicadores-chave de performance (KPIs) de negócios, a telemetria de aplicações informa a maneira como você cria, opera e desenvolve sua workload.
Métricas, logs e rastreamentos formam os três pilares principais da observabilidade. Eles servem como ferramentas de diagnóstico que descrevem o estado de sua aplicação. Com o tempo, eles auxiliam na criação de linhas de base e na identificação de anomalias. No entanto, para garantir o alinhamento entre as atividades de monitoramento e os objetivos de negócios, é fundamental definir e monitorar os KPIs. Os KPIs de negócios geralmente facilitam a identificação de problemas em comparação com métricas técnicas isoladas.
Outros tipos de telemetria, como monitoramento de usuários reais (RUM) e transações sintéticas, complementam essas fontes de dados primárias. O RUM oferece informações sobre as interações do usuário em tempo real, enquanto as transações sintéticas simulam possíveis comportamentos do usuário, ajudando a detectar gargalos antes que usuários reais os encontrem.
Resultado desejado: obtenha insights acionáveis sobre a performance da sua workload. Esses insights permitem que você tome decisões proativas sobre otimização de performance, tenha maior estabilidade da workload, simplifique os processos de CI/CD e utilize recursos de forma eficaz.
Práticas comuns que devem ser evitadas:
-
Observabilidade incompleta: negligência da incorporação da observabilidade em todas as camadas da workload, resultando em pontos cegos que podem obscurecer insights vitais sobre performance e comportamento do sistema.
-
Visualização fragmentada dos dados: quando os dados estão espalhados por várias ferramentas e sistemas, torna-se difícil manter uma visão holística da integridade e da performance da sua workload.
-
Problemas relatados pelo usuário: um sinal de que falta a detecção proativa de problemas por meio da telemetria e do monitoramento de KPI de negócios.
Benefícios de implementar esta prática recomendada:
-
Tomada de decisão informada: com insights de telemetria e KPIs de negócios, você pode tomar decisões baseadas em dados.
-
Eficiência operacional aprimorada: a utilização de recursos baseada em dados leva à redução de custos.
-
Estabilidade aprimorada da workload: detecção e resolução mais rápidas de problemas, levando a um melhor tempo de atividade.
-
Processos racionalizados de CI/CD: os insights dos dados de telemetria facilitam o refinamento dos processos e a entrega confiável de código.
Nível de risco exposto se esta prática recomendada não for estabelecida: Alto
Orientação para implementação
Para implementar a telemetria de aplicações para sua workload, use serviços da AWS como o Amazon CloudWatch
Etapas de implementação
-
Identifique quais dados coletar: determine as métricas essenciais, os logs e os rastreamentos essenciais que ofereceriam informações substanciais sobre a integridade, a performance e o comportamento da sua workload.
-
Implante o agente do CloudWatch
: o agente do CloudWatch é fundamental na aquisição de métricas do sistema e da aplicação e de logs de sua workload e de sua infraestrutura subjacente. O agente do CloudWatch também pode ser usado para coletar OpenTelemetry ou rastreamentos do X-Ray e enviá-los ao X-Ray. -
Implemente a detecção de anomalias para logs e métricas: use a detecção de anomalias do CloudWatch Logs e a detecção de anomalias do CloudWatch Metrics para identificar automaticamente atividades incomuns nas operações da aplicação. Essas ferramentas usam algoritmos de machine learning para detectar e alertar sobre anomalias, o que aprimora os recursos de monitoramento e acelera o tempo de resposta a possíveis interrupções ou ameaças à segurança. Configure esses recursos para gerenciar proativamente a integridade e a segurança das aplicações.
-
Proteja dados de log confidenciais: use a proteção de dados do Amazon CloudWatch Logs para mascarar informações confidenciais em seus logs. Esse recurso ajuda a manter a privacidade e a conformidade por meio da detecção automática e do mascaramento de dados confidenciais antes de serem acessados. Implemente o mascaramento de dados para tratar e proteger com segurança detalhes confidenciais, como informações de identificação pessoal (PII).
-
Defina e monitore os KPIs de negócios: estabeleça métricas personalizadas que se alinhem aos seus resultados de negócios
. -
Instrumente sua aplicação com o AWS X-Ray: além de implantar o agente CloudWatch, é fundamental instrumentar sua aplicação para emitir dados de rastreamento. Esse processo pode fornecer mais insights sobre o comportamento e a performance da workload.
-
Padronize a coleta de dados em toda a sua aplicação: padronize as práticas de coleta de dados em toda a aplicação. A uniformidade ajuda a correlacionar e analisar dados, fornecendo uma visão abrangente do comportamento da aplicação.
-
Implemente a observabilidade entre contas: aumente a eficiência do monitoramento entre várias Contas da AWS com a observabilidade entre contas do Amazon CloudWatch. Com esse recurso, é possível consolidar métricas, logs e alarmes de contas diferentes em uma única visualização, o que simplifica o gerenciamento e melhora os tempos de resposta para problemas identificados em todo o ambiente da AWS da organização.
-
Analise e aja com base em dados: quando a coleta e a normalização dos dados estiverem implementadas, use o Amazon CloudWatch
para análise de métricas e logs e o AWS X-Ray para análise de rastreamento. Essa análise pode gerar informações cruciais sobre a integridade, a performance e o comportamento da workload, orientando o processo de tomada de decisão.
Nível de esforço do plano de implementação: Alto
Recursos
Práticas recomendadas relacionadas:
Documentos relacionados:
Vídeos relacionados:
Exemplos relacionados: