View a markdown version of this page

Prevención proactiva de incidentes - AWS DevOps Agente

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Prevención proactiva de incidentes

AWS DevOps El agente analiza los patrones de sus investigaciones de incidentes para ofrecer recomendaciones específicas que mejoren continuamente su postura operativa y eviten futuros incidentes. Acceda a la prevención proactiva de incidentes a través de la página Ops Backlog de la aplicación web Operator.

Cómo funciona la prevención proactiva de incidentes

AWS DevOps El agente evalúa las investigaciones de incidentes recientes para identificar mejoras duraderas a fin de prevenir futuros incidentes y acelerar el tiempo medio de detección (MTTD). El agente analiza varios incidentes para identificar recomendaciones que puedan prevenir toda clase de incidentes en el futuro, centrándose en las recomendaciones más impactantes para garantizar que sean procesables.

De forma predeterminada, el agente realiza evaluaciones automáticamente cada semana. Puede pausar la programación si prefiere ejecutar las evaluaciones solo a pedido. Las evaluaciones manuales están siempre disponibles, lo que resulta útil cuando una investigación reciente justifica una revisión rápida de las mejoras recomendadas.

El agente identifica las mejoras en cuatro categorías, que se muestran en el cuadro de categorización de recomendaciones de la página del registro de operaciones pendientes:

  • Observabilidad: recomendaciones para mejorar la supervisión, las alertas, el registro y la visibilidad del sistema a fin de detectar problemas de forma más rápida y precisa.

  • Infraestructura: recomendaciones para optimizar las configuraciones de los recursos, el ajuste de la capacidad y la resiliencia de la arquitectura.

  • Gobernanza: recomendaciones para reforzar los procesos de implementación, las mejoras en los procesos, las prácticas de prueba y los controles operativos.

  • Optimización del código: recomendaciones para mejorar la calidad del código de las aplicaciones, la gestión de errores y la resiliencia del código.

Esta categorización le ayuda a comprender dónde son más necesarias sus mejoras operativas y le permite priorizar las recomendaciones en función de las áreas de interés de su equipo.

Ventajas

  • Evite los incidentes recurrentes: aborde las causas fundamentales de forma sistemática en lugar de responder repetidamente a los mismos tipos de problemas

  • Reduzca el esfuerzo operativo: libere a su equipo de la repetitiva lucha contra incendios y céntrese en la innovación y las mejoras estratégicas

  • Mejore la resiliencia del sistema: refuerce sus procesos de infraestructura, observabilidad e implementación basándose en datos de incidentes reales

  • Aprenda de los patrones históricos: aproveche la información de los incidentes pasados para realizar mejoras específicas que tengan el mayor impacto

Resumen del agente

El resumen del agente en la página de registro de operaciones de la aplicación web proporciona una descripción de los resultados de la última evaluación de los incidentes recientes. El resumen explica el número de investigaciones de incidentes analizadas, qué incidentes son similares a los anteriores y qué recomendaciones se crearon o actualizaron con nueva información.

El resumen le ayuda a comprender rápidamente lo que el agente descubrió durante su evaluación más reciente y destaca las recomendaciones más destacadas que podrían tener un mayor impacto en su postura operativa.

Controlar las evaluaciones

Puede controlar cuándo el AWS DevOps agente evalúa los incidentes y genera recomendaciones:

  • Ejecutar las evaluaciones manualmente: haga clic en el botón Ejecutar ahora en la página del registro de operaciones pendientes para iniciar una evaluación de inmediato. Esto resulta útil cuando una investigación reciente justifica una revisión rápida de las mejoras recomendadas.

  • Detener las evaluaciones activas: haga clic en el botón Detener la evaluación en la página del registro de operaciones pendientes para detener una evaluación que esté en curso actualmente.

Administrar las recomendaciones

AWS DevOps El agente proporciona recomendaciones en la página del registro de operaciones pendientes, donde puede revisarlas y gestionarlas:

  • Ver los detalles de las recomendaciones: haga clic en una recomendación para abrir la página de detalles de la recomendación, donde podrá ver más información sobre la mejora sugerida, incluidos los incidentes en los que se basó la recomendación, los impactos esperados y los próximos pasos a seguir. Para obtener recomendaciones sobre cambios en el código, también puede consultar la especificación lista para el agente, que se puede entregar a un agente de codificación para su implementación.

  • Conservar: haz clic en «Conservar» para conservar una recomendación en tu lista de pedidos pendientes y poder hacer un seguimiento de ella. Esto le permite controlar las mejoras que planea implementar y realizar un seguimiento de su progreso.

  • Descartar: haz clic en «Descartar» para eliminar una recomendación de tu lista de pedidos pendientes. Cuando descartas una recomendación, puedes explicar en lenguaje natural por qué no se ajusta a tus necesidades. El agente aprende de estos comentarios y los utiliza para fundamentar sus futuras recomendaciones, asegurándose de que se adapten mejor a sus prioridades y requisitos operativos a lo largo del tiempo.

  • Implementada: haga clic en «Implementada» para marcar una recomendación como completada. Esto le ayuda a realizar un seguimiento de las mejoras que se han aplicado y permite al agente medir la eficacia de sus recomendaciones a lo largo del tiempo.

  • Eliminación automática: las recomendaciones que no se hayan marcado como conservadas o implementadas se pueden eliminar al cabo de aproximadamente 6 semanas si no se hubieran evitado nuevos incidentes con la aplicación de la recomendación. Esto garantiza que la página del registro de operaciones pendientes se centre en las mejoras más relevantes para sus desafíos operativos.

  • Actualizaciones de las recomendaciones: las recomendaciones existentes se actualizan cuando se detectan nuevos incidentes que la recomendación habría evitado. Las actualizaciones pueden cambiar la prioridad de la recomendación o refinarla en función de los nuevos conocimientos.

Especificaciones listas para usar como agentes

Para las recomendaciones que impliquen cambios en el código o la configuración, AWS DevOps Agent puede generar una especificación lista para el agente. Esta especificación proporciona un documento estructurado que se puede entregar directamente a un agente de codificación para su implementación.

La especificación incluye:

  • Enunciado del problema: un resumen del problema y su causa raíz

  • Resumen de la solución: descripción detallada del enfoque recomendado

  • Repositorios de destino: los repositorios específicos en los que es necesario realizar cambios

  • Cambios de código: descripciones detalladas de lo que debe cambiar y por qué, con rutas de archivo específicas y consideraciones de implementación

  • Requisitos de las pruebas: ¿Qué escenarios deben probarse

  • Plan de implementación: un enfoque gradual para implementar los cambios

Las especificaciones listas para el agente aceleran la implementación al proporcionar a los agentes de codificación el contexto que necesitan para realizar cambios listos para la producción sin tener que recurrir a los ingenieros. back-and-forth

Implementación de recomendaciones

Para maximizar el valor de las recomendaciones proactivas de prevención de incidentes, considere las siguientes prácticas para ponerlas en práctica:

  • Uso de especificaciones listas para el uso de agentes: para obtener recomendaciones con cambios en el código, utilice la especificación generada para acelerar la implementación entregándola a un agente de codificación o utilizándola como guía detallada para la implementación manual.

  • Añadir recomendaciones a tu cartera de pedidos pendientes: copia las recomendaciones al sistema de gestión de proyectos o al sistema de gestión de proyectos de tu equipo para asegurarte de que se les dé prioridad junto con otros trabajos de ingeniería.

  • Priorizar las recomendaciones en función del impacto: céntrese primero en las recomendaciones que aborden los tipos de incidentes más frecuentes o graves, o aquellos que afectan a los sistemas críticos.

  • Seguimiento del progreso de la implementación: supervise qué recomendaciones se han implementado y mida su eficacia observando si los incidentes similares disminuyen con el tiempo.

  • Coordinación con los equipos de desarrollo: comparta las recomendaciones con los equipos correspondientes que son propietarios de los sistemas afectados, asegurándose de que cuentan con el contexto y los recursos necesarios para implementar las mejoras.