Preparación para incidentes en Incident Manager

La planificación de un incidente comienza mucho antes del ciclo de vida del incidente. Como se muestra en la siguiente ilustración, antes de empezar a responder a los incidentes, hay que prepararse configurando los canales de chat, creando planes de escalamiento, especificando los contactos y determinando los manuales de automatización que se van a utilizar en la respuesta a los incidentes. A continuación, utilice un plan de respuesta que especifique cómo se lleva a cabo la supervisión y si las respuestas están automatizadas. Una vez completada la remediación, puede analizar el incidente y la respuesta al incidente para perfeccionar aún más su plan de respuesta para futuros incidentes.

Un flujo de trabajo de Incident Manager para prepararse para los incidentes, responder a ellos y aprender de ellos.

Temas

Monitorización

Supervisar el estado de las aplicaciones AWS alojadas es clave para garantizar el tiempo de actividad y el rendimiento de las aplicaciones. A la hora de determinar las soluciones de monitoreo, tenga en cuenta lo siguiente:

Criticidad de la característica: si el sistema fallara, ¿cuán crítico sería el impacto para los usuarios intermedios?
Comunalidad de los fallos: con qué frecuencia falla un sistema; los sistemas que requieren una intervención frecuente deben ser monitoreados de cerca.
Aumento de la latencia: cuánto ha aumentado o disminuido el tiempo necesario para completar una tarea.
Métricas del lado del cliente vs. métricas del lado del servidor: si existe una discrepancia entre las métricas relacionadas en el cliente y en el servidor.
Fallos de dependencia: fallos para los que su equipo puede y debería prepararse.

Después de crear planes de respuesta, puede utilizar sus soluciones de monitoreo para hacer un seguimiento automático de los incidentes en el momento en que se produzcan en su entorno. Para obtener más información sobre el seguimiento y la creación de incidentes, consulte Visualización de los detalles del incidente en la consola de Incident Manager.

Para obtener más información sobre cómo diseñar aplicaciones y cargas de trabajo de infraestructura seguras, de alto rendimiento, resilientes y eficientes, consulte Well-Architected.AWS

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Gestión de incidentes en todas Cuentas de AWS las regiones

Configuración de los conjuntos de replicación y los resultados