Che cos'è il rilevamento e la risposta agli AWS incidenti? - AWSGuida per l'utente di rilevamento e risposta agli incidenti

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Che cos'è il rilevamento e la risposta agli AWS incidenti?

AWSIncident Detection and Response offre ai clienti idonei di AWS Enterprise Support un coinvolgimento proattivo degli incidenti per ridurre il potenziale di guasto e accelerare il ripristino dei carichi di lavoro critici in caso di interruzioni. Incident Detection and Response facilita la collaborazione AWS per sviluppare runbook e piani di risposta personalizzati per ogni carico di lavoro integrato.

Incident Detection and Response offre le seguenti funzionalità chiave:

  • Migliore osservabilità: AWS gli esperti forniscono indicazioni per aiutarvi a definire e correlare metriche e allarmi tra i livelli applicativo e infrastrutturale del carico di lavoro per rilevare tempestivamente le interruzioni.

  • Tempo di risposta di 5 minuti: IMEs monitora i carichi di lavoro integrati 24 ore su 24, 7 giorni su 7 per rilevare incidenti critici. IMEsRisponde entro 5 minuti dall'attivazione di un allarme o in risposta a un caso di supporto critico per l'azienda da te segnalato a Incident Detection and Response.

  • Risoluzione più rapida: IMEs utilizza runbook predefiniti e personalizzati sviluppati per i tuoi carichi di lavoro per rispondere entro 5 minuti, creare un caso Support per tuo conto e gestire gli incidenti sul tuo carico di lavoro. IMEsgarantisci la gestione unificata degli incidenti e mantieni il contatto con gli esperti giusti fino alla loro risoluzione. AWS

  • Gestione degli incidenti per AWS gli eventi: poiché comprendiamo il contesto del carico di lavoro critico (ad esempio, account, servizi e istanze), possiamo rilevare e notificare in modo proattivo un potenziale impatto sul carico di lavoro durante un evento di servizio. AWS Se richiesto, IMEs coinvolgete l'utente durante gli eventi AWS di servizio e fornite aggiornamenti sugli eventi. Sebbene Incident Detection and Response non possa dare priorità al ripristino durante un evento di servizio, Incident Detection and Response fornisce una guida di Support per aiutarti a implementare il tuo piano di mitigazione.

  • Riduzione del rischio di guasto: dopo la risoluzione, IMEs forniscono una revisione post-incidente (su richiesta). Inoltre, gli AWS esperti collaborano con voi per applicare le lezioni apprese per migliorare il piano di risposta agli incidenti e i runbook. Puoi anche sfruttare AWS Resilience Hub per il monitoraggio continuo della resilienza dei tuoi carichi di lavoro.