View a markdown version of this page

Prevenzione proattiva degli incidenti - AWS DevOps Agente

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prevenzione proattiva degli incidenti

AWS DevOps L'agente analizza i modelli delle indagini sugli incidenti per fornire raccomandazioni mirate che migliorano continuamente la postura operativa e prevengono incidenti futuri. Accedi alla prevenzione proattiva degli incidenti tramite la pagina Ops Backlog nell'app Web Operator.

Come funziona la prevenzione proattiva degli incidenti

AWS DevOps L'agente valuta le indagini recenti sugli incidenti per identificare miglioramenti duraturi per prevenire incidenti futuri e accelerare il tempo medio di rilevamento (MTTD). L'agente analizza più incidenti per identificare le raccomandazioni che potrebbero prevenire intere classi di incidenti in futuro, concentrandosi sulle raccomandazioni più efficaci per garantire che siano attuabili.

Per impostazione predefinita, l'agente esegue automaticamente le valutazioni settimanali. Puoi mettere in pausa la pianificazione se preferisci eseguire le valutazioni solo su richiesta. Le valutazioni manuali sono sempre disponibili, il che è utile quando un'indagine recente giustifica una rapida risposta ai miglioramenti consigliati.

L'agente identifica i miglioramenti in quattro categorie, mostrati nella tabella di categorizzazione dei consigli nella pagina Ops Backlog:

  • Osservabilità: raccomandazioni per migliorare il monitoraggio, gli avvisi, la registrazione e la visibilità del sistema per rilevare i problemi in modo più rapido e preciso.

  • Infrastruttura: consigli per ottimizzare le configurazioni delle risorse, l'ottimizzazione della capacità e la resilienza dell'architettura.

  • Governance: raccomandazioni per rafforzare i processi di implementazione, i miglioramenti della pipeline, le pratiche di test e i controlli operativi.

  • Ottimizzazione del codice: raccomandazioni per migliorare la qualità del codice delle applicazioni, la gestione degli errori e la resilienza del codice.

Questa categorizzazione ti aiuta a capire dove sono più necessari i miglioramenti operativi e ti consente di dare priorità ai consigli in base alle aree di interesse del tuo team.

Vantaggi

  • Prevenzione degli incidenti ricorrenti: affronta le cause alla radice in modo sistematico anziché rispondere ripetutamente allo stesso tipo di problemi

  • Riduci la fatica operativa: libera il tuo team da interventi antincendio ripetitivi per concentrarsi sull'innovazione e sui miglioramenti strategici

  • Migliora la resilienza del sistema: rafforza l'infrastruttura, l'osservabilità e i processi di implementazione sulla base di dati reali sugli incidenti

  • Impara dai modelli storici: sfrutta gli approfondimenti degli incidenti passati per apportare miglioramenti mirati che abbiano il maggiore impatto

Riepilogo degli agenti

Il riepilogo dell'agente nella pagina Ops Backlog dell'app Web fornisce una descrizione dei risultati dell'ultima valutazione degli incidenti recenti. Il riepilogo spiega il numero di indagini sugli incidenti analizzate, quali incidenti sono simili a quelli passati e quali raccomandazioni sono state create o aggiornate con nuove informazioni.

Il riepilogo aiuta a comprendere rapidamente ciò che l'agente ha scoperto durante la sua valutazione più recente ed evidenzia le raccomandazioni più importanti che potrebbero avere il maggiore impatto sulla postura operativa.

Controllo delle valutazioni

È possibile controllare quando AWS DevOps Agent valuta gli incidenti e genera raccomandazioni:

  • Esecuzione manuale delle valutazioni: fai clic sul pulsante Esegui ora nella pagina Ops Backlog per avviare immediatamente una valutazione. Ciò è utile quando un'indagine recente giustifica una rapida risposta ai miglioramenti consigliati.

  • Interruzione delle valutazioni attive: fai clic sul pulsante Stop Evaluation nella pagina Ops Backlog per interrompere una valutazione attualmente in corso.

Gestione dei consigli

AWS DevOps L'agente fornisce consigli nella pagina Ops Backlog in cui è possibile esaminarli e gestirli:

  • Visualizzazione dei dettagli del consiglio: fai clic su un consiglio per aprire la pagina dei dettagli del consiglio, dove puoi visualizzare ulteriori informazioni sul miglioramento suggerito, inclusi gli incidenti che hanno portato alla raccomandazione, gli impatti previsti e i passaggi successivi. Per consigli sulle modifiche al codice, puoi anche visualizzare le specifiche pronte per l'uso con l'agente che possono essere consegnate a un agente di codifica per l'implementazione.

  • Conserva: fai clic su «Mantieni» per conservare una raccomandazione nel backlog a fini di tracciamento. In questo modo puoi monitorare i miglioramenti che intendi implementare e monitorarne i progressi.

  • Ignora: fai clic su «Ignora» per rimuovere una raccomandazione dal backlog. Quando scartate un consiglio, potete fornire una spiegazione in linguaggio naturale del motivo per cui non soddisfa le vostre esigenze. L'agente apprende da questo feedback e lo utilizza per fornire raccomandazioni future, assicurando che diventino più allineate con le priorità e i requisiti operativi nel tempo.

  • Implementato: fai clic su «Implementato» per contrassegnare una raccomandazione come completata. Ciò consente di tenere traccia dei miglioramenti applicati e consente all'agente di misurare l'efficacia dei suoi consigli nel tempo.

  • Rimozione automatica: i consigli che non sono stati contrassegnati come Mantieni o Implementati possono essere rimossi dopo circa 6 settimane se non fosse stato possibile prevenire nuovi incidenti implementando la raccomandazione. Ciò garantisce che la pagina Ops Backlog si concentri sui miglioramenti più pertinenti per le vostre sfide operative.

  • Aggiornamenti dei consigli: i consigli esistenti vengono aggiornati quando vengono rilevati nuovi incidenti che sarebbero stati evitati dalla raccomandazione. Gli aggiornamenti possono modificare la priorità della raccomandazione o perfezionarla in base a nuove informazioni.

Specifiche pronte per l'uso con l'agente

Per suggerimenti che comportano modifiche al codice o alla configurazione, AWS DevOps Agent può generare una specifica pronta per l'uso con l'agente. Questa specifica fornisce un documento strutturato che può essere consegnato direttamente a un agente di codifica per l'implementazione.

La specifica include:

  • Dichiarazione del problema: un riepilogo del problema e della sua causa principale

  • Riepilogo della soluzione: una descrizione di alto livello dell'approccio consigliato

  • Archivi di destinazione: i repository specifici in cui è necessario apportare modifiche

  • Modifiche al codice: descrizioni dettagliate di cosa è necessario modificare e perché, con percorsi di file specifici e considerazioni sull'implementazione

  • Requisiti dei test: quali scenari devono essere testati

  • Piano di implementazione: un approccio graduale all'implementazione delle modifiche

Le specifiche Agent-Ready accelerano l'implementazione fornendo agli agenti di codifica il contesto necessario per apportare modifiche pronte per la produzione senza dover ricorrere a lunghi interventi di progettazione. back-and-forth

Suggerimenti per l'implementazione

Per massimizzare il valore delle raccomandazioni proattive sulla prevenzione degli incidenti, prendete in considerazione le seguenti pratiche per agire di conseguenza:

  • Utilizzo di specifiche pronte per l'uso con agenti: per suggerimenti relativi alle modifiche al codice, utilizzate le specifiche generate per accelerare l'implementazione consegnandole a un agente di codifica o utilizzandole come guida dettagliata per l'implementazione manuale.

  • Aggiungere consigli al backlog dei ticket: copia i consigli nel sistema di ticketing o nello strumento di gestione dei progetti del team per assicurarti che abbiano la priorità rispetto ad altri lavori di ingegneria.

  • Dare priorità ai consigli in base all'impatto: concentrati innanzitutto sui consigli che riguardano i tipi di incidenti più frequenti o gravi o quelli che interessano i sistemi critici.

  • Monitoraggio dei progressi nell'implementazione: monitora quali raccomandazioni sono state implementate e misurane l'efficacia osservando se incidenti simili diminuiscono nel tempo.

  • Coordinamento con i team di sviluppo: condividi le raccomandazioni con i team appropriati che possiedono i sistemi interessati, assicurandoti che dispongano del contesto e delle risorse necessari per implementare i miglioramenti.