Préparation aux incidents dans Incident Manager

La planification d'un incident commence bien avant le cycle de vie de l'incident. Comme le montre l'illustration suivante, avant de commencer à répondre aux incidents, vous devez vous préparer en configurant des canaux de discussion, en créant des plans d'escalade, en spécifiant les contacts et en déterminant les runbooks d'automatisation à utiliser pour répondre aux incidents. Utilisez ensuite un plan de réponse qui précise le mode de surveillance et indique si les réponses sont automatisées. Une fois la correction terminée, vous pouvez analyser l'incident et la réponse à l'incident afin d'affiner votre plan de réponse pour les futurs incidents.

Un flux de travail de gestion des incidents permettant de se préparer aux incidents, d'y répondre et d'en tirer des leçons.

Rubriques

Surveillance

La surveillance de l'état de vos applications AWS hébergées est essentielle pour garantir le temps de disponibilité et les performances des applications. Lorsque vous déterminez des solutions de surveillance, tenez compte des points suivants :

Criticité de la fonctionnalité — Si le système devait tomber en panne, quel en serait l'impact critique pour les utilisateurs en aval.
Caractère commun des défaillances — Quelle est la fréquence des défaillances d'un système ? Les systèmes nécessitant des interventions fréquentes doivent être étroitement surveillés.
Latence accrue : augmentation ou diminution du temps nécessaire à l'exécution d'une tâche.
Mesures côté client et côté serveur : en cas de divergence entre les mesures associées sur le client et sur le serveur.
Défaillances de dépendance : défaillances auxquelles votre équipe peut et doit se préparer.

Après avoir créé des plans de réponse, vous pouvez utiliser vos solutions de surveillance pour suivre automatiquement les incidents dès qu'ils se produisent dans votre environnement. Pour plus d'informations sur le suivi et la création d'incidents, consultezAfficher les détails de l'incident dans la console Incident Manager.

Pour plus d'informations sur l'architecture d'applications et de charges de travail d'infrastructure sécurisées, performantes, résilientes et efficaces, consultez le Well-Architected.AWS

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Gestion des incidents dans toutes Comptes AWS les régions

Configuration des ensembles de réplication et des résultats