As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Prevenção proativa de incidentes
AWS DevOps O agente analisa padrões em suas investigações de incidentes para fornecer recomendações direcionadas que melhoram continuamente sua postura operacional e evitam futuros incidentes. Acesse a prevenção proativa de incidentes por meio da página Ops Backlog no Operator Web App.
Como funciona a prevenção proativa de incidentes
AWS DevOps O agente avalia investigações recentes de incidentes para identificar melhorias duradouras para evitar futuros incidentes e acelerar o tempo médio de detecção (MTTD). O agente analisa vários incidentes para identificar recomendações que possam evitar classes inteiras de incidentes no futuro, concentrando-se nas recomendações mais impactantes para garantir que sejam acionáveis.
Por padrão, o agente executa automaticamente as avaliações semanalmente. Você pode pausar o cronograma se preferir executar avaliações somente sob demanda. As avaliações manuais estão sempre disponíveis, o que é útil quando uma investigação recente garante uma rápida resposta às melhorias recomendadas.
O agente identifica melhorias em quatro categorias, mostradas no gráfico de categorização de recomendações na página Ops Backlog:
Observabilidade — Recomendações para aprimorar o monitoramento, os alertas, o registro e a visibilidade do sistema para detectar problemas com mais rapidez e precisão.
Infraestrutura — recomendações para otimizar as configurações de recursos, o ajuste de capacidade e a resiliência arquitetônica.
Governança — Recomendações para fortalecer os processos de implantação, melhorias no pipeline, práticas de teste e controles operacionais.
Otimização de código — Recomendações para melhorar a qualidade do código do aplicativo, o tratamento de erros e a resiliência do código.
Essa categorização ajuda você a entender onde suas melhorias operacionais são mais necessárias e permite que você priorize as recomendações com base nas áreas de foco da sua equipe.
Benefícios
Evite incidentes recorrentes — Aborde as causas básicas de forma sistemática, em vez de responder repetidamente aos mesmos tipos de problemas
Reduza o trabalho operacional — liberte sua equipe do combate repetitivo a incêndios para se concentrar na inovação e nas melhorias estratégicas
Melhore a resiliência do sistema — Fortaleça sua infraestrutura, observabilidade e processos de implantação com base em dados reais de incidentes
Aprenda com os padrões históricos — Aproveite os insights de incidentes anteriores para fazer melhorias direcionadas que tenham o maior impacto
Resumo do agente
O resumo do agente na página Ops Backlog do aplicativo Web fornece uma descrição dos resultados da última avaliação de incidentes recentes. O resumo explica o número de investigações de incidentes analisadas, quais incidentes são semelhantes aos anteriores e quais recomendações foram criadas ou atualizadas com novas informações.
O resumo ajuda você a entender rapidamente o que o agente descobriu durante sua avaliação mais recente e destaca as recomendações mais notáveis que podem ter o maior impacto em sua postura operacional.
Controlando avaliações
Você pode controlar quando o AWS DevOps Agente avalia incidentes e gera recomendações:
Executando avaliações manualmente — Clique no botão Executar agora na página Ops Backlog para iniciar uma avaliação imediatamente. Isso é útil quando uma investigação recente garante uma rápida reviravolta nas melhorias recomendadas.
Interromper avaliações ativas — Clique no botão Interromper avaliação na página Ops Backlog para interromper uma avaliação que está em andamento no momento.
Gerenciando recomendações
AWS DevOps O agente fornece recomendações na página Ops Backlog, onde você pode analisá-las e gerenciá-las:
Visualizando detalhes da recomendação — Clique em uma recomendação para abrir a página de detalhes da recomendação, onde você pode ver mais informações sobre a melhoria sugerida, incluindo os incidentes que informaram a recomendação, os impactos esperados e as próximas etapas. Para recomendações com alterações de código, você também pode visualizar a especificação pronta para agente que pode ser entregue a um agente de codificação para implementação.
Manter — Clique em “Manter” para manter uma recomendação em sua lista de pendências para rastreamento. Isso permite monitorar quais melhorias você planeja implementar e acompanhar seu progresso.
Descartar — Clique em “Descartar” para remover uma recomendação da sua lista de pendências. Ao descartar uma recomendação, você pode fornecer uma explicação em linguagem natural do motivo pelo qual ela não atende às suas necessidades. O agente aprende com esse feedback e o usa para embasar recomendações futuras, garantindo que elas se tornem mais alinhadas com suas prioridades e requisitos operacionais ao longo do tempo.
Implementada — Clique em “Implementada” para marcar uma recomendação como concluída. Isso ajuda você a monitorar quais melhorias foram aplicadas e permite que o agente meça a eficácia de suas recomendações ao longo do tempo.
Remoção automática — As recomendações que não foram marcadas como Manter ou Implementadas podem ser removidas após aproximadamente 6 semanas se nenhum novo incidente tivesse sido evitado com a implementação da recomendação. Isso garante que a página Ops Backlog se concentre nas melhorias mais relevantes para seus desafios operacionais.
Atualizações de recomendações — As recomendações existentes são atualizadas quando são encontrados novos incidentes que teriam sido evitados pela recomendação. As atualizações podem alterar a prioridade da recomendação ou refiná-la com base em novos insights.
Especificações prontas para agentes
Para recomendações que envolvam alterações no código ou na configuração, o AWS DevOps Agente pode gerar uma especificação pronta para o agente. Essa especificação fornece um documento estruturado que pode ser entregue diretamente a um agente de codificação para implementação.
A especificação inclui:
Declaração do problema — Um resumo do problema e sua causa raiz
Resumo da solução — Uma descrição de alto nível da abordagem recomendada
Repositórios de destino — Os repositórios específicos em que as alterações precisam ser feitas
Alterações no código — descrições detalhadas do que precisa ser mudado e por quê, com caminhos de arquivo específicos e considerações de implementação
Requisitos de teste — Quais cenários precisam ser testados
Plano de implementação — Uma abordagem em fases para implementar as mudanças
As especificações prontas para agentes aceleram a implementação, fornecendo aos agentes de codificação o contexto de que precisam para fazer alterações prontas para a produção sem exigir muitos engenheiros. back-and-forth
Implementando recomendações
Para maximizar o valor das recomendações proativas de prevenção de incidentes, considere as seguintes práticas para agir de acordo com elas:
Usando especificações prontas para agentes — Para recomendações com alterações de código, use a especificação gerada para acelerar a implementação, entregando-a a um agente de codificação ou usando-a como um guia detalhado para implementação manual.
Adicionar recomendações à sua lista de pedidos — Copie as recomendações para o sistema de emissão de tíquetes ou para a ferramenta de gerenciamento de projetos da sua equipe para garantir que elas sejam priorizadas junto com outros trabalhos de engenharia.
Priorizando recomendações com base no impacto — Concentre-se primeiro nas recomendações que abordam os tipos de incidentes mais frequentes ou graves, ou aqueles que afetam sistemas críticos.
Acompanhamento do progresso da implementação — Monitore quais recomendações foram implementadas e meça sua eficácia observando se incidentes semelhantes diminuem com o tempo.
Coordenação com as equipes de desenvolvimento — Compartilhe recomendações com as equipes apropriadas que são proprietárias dos sistemas afetados, garantindo que elas tenham o contexto e os recursos necessários para implementar melhorias.