Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación y configuración de planes de respuesta en Incident Manager
Los planes de respuesta le permiten planificar cómo responder a un incidente que afecte a sus usuarios. Un plan de respuesta funciona como una plantilla que incluye información sobre a quién involucrar, la gravedad prevista del suceso, los manuales de procedimientos automáticos por iniciar y las métricas por monitorear.
Prácticas recomendadas
Puede reducir el impacto de los incidentes en sus equipos al planificarlos con antelación. Los equipos deberían tener en cuenta las siguientes prácticas recomendadas al diseñar un plan de respuesta.
-
Participación racionalizada: identifique el equipo más apropiado para un incidente. Si involucra una lista de distribución demasiado amplia, o si involucra a equipos equivocados, podría causar confusión y hacer perder tiempo a los respondedores durante un incidente.
-
Escalada fiable: para sus compromisos en un plan de respuesta, le recomendamos que seleccione un plan de participación en vez de contactos u horarios de guardia. El plan de participación debe especificar los contactos individuales o los horarios de guardia (que contienen múltiples contactos rotativos) que debe involucrar durante los incidentes. Dado que los respondedores especificados en su plan de participación podrían resultar inaccesibles en ocasiones, deberá configurar respondedores de reserva en su plan de respuesta para cubrir estos escenarios. Con contactos de reserva, si los contactos principal y secundario no estuvieran disponibles o hubiera otras lagunas no planificadas en la cobertura, Incident Manager seguirá notificando el incidente a un contacto.
-
Manuales de procedimientos: utilice los manuales de procedimientos para proporcionar pasos repetibles y comprensibles que reduzcan el estrés que experimenta un respondedor durante un incidente.
-
Colaboración: utilice los canales de chat para agilizar la comunicación durante los incidentes. Los canales de chat ayudan a los respondedores a mantenerse al día con la información. También pueden compartir información con otros respondedores a través de estos canales.
Creación de un plan de respuesta
Utilice el siguiente procedimiento para crear un plan de respuesta y automatizar la respuesta a incidentes.
Para crear un plan de respuesta
-
Abra la consola de Incident Manager
y, en el panel de navegación, elija Planes de respuesta. -
Elija Crear plan de respuesta.
-
En Nombre, introduzca un nombre de plan de respuesta único e identificable para usarlo en el nombre del recurso de Amazon (ARN) del plan de respuesta.
-
(Opcional) En Nombre para mostrar, introduzca un nombre más legible para las personas que le ayude a identificar el plan de respuesta al crear incidentes.
-
Realice a continuación la Especificación de valores predeterminados para los registros de incidentes.
Especificación de valores predeterminados para incidentes
Para ayudarle a administrar los incidentes de forma más eficaz, puede especificar valores predeterminados. Incident Manager aplica estos valores a todos los incidentes que estén asociados a un plan de respuesta.
Para especificar valores predeterminados de incidentes
-
En Título, introduzca un título para este incidente que le ayude a identificarlo en la página de inicio de Incident Manager.
-
En Impacto, elija un nivel de impacto para indicar el alcance potencial de un incidente creado a partir de este plan de respuesta, como Crítico o Bajo. Para obtener información sobre los niveles de impacto en Incident Manager, consulte Triaje.
-
(Opcional) En Resumen, introduzca un breve resumen del tipo de incidente creado a partir de este plan de respuesta.
-
(Opcional) En Cadena de deduplicación, introduzca una cadena de deduplicación. Incident Manager utiliza esta cadena para evitar que la misma causa raíz cree varios incidentes en la misma cuenta.
Una cadena de deduplicación es un término o frase que el sistema utiliza para buscar incidentes duplicados. Si especifica una cadena de deduplicación, Incident Manager busca incidentes abiertos que contengan la misma cadena en el campo
dedupeString
al crear el incidente. Si se detecta un duplicado, Incident Manager deduplica el incidente más reciente en el incidente existente.nota
De forma predeterminada, Incident Manager deduplica automáticamente varios incidentes creados por la misma CloudWatch alarma o evento de Amazon EventBridge . No es necesario que introduzca su propia cadena de deduplicación para evitar la duplicación para estos tipos de recursos.
-
(Opcional) En Etiquetas de incidentes, añada claves y valores de etiqueta para asignar a los incidentes creados por este plan de respuesta.
Debe tener el permiso
TagResource
para el recurso de registro de incidentes a fin de establecer etiquetas de incidentes dentro del plan de respuesta. -
Realice a continuación la Especificación de un canal de chat opcional para que los respondedores comuniquen entre sí acerca de los incidentes.
(Opcional) Especificación de un canal de chat de respuesta a incidentes
Al incluir un canal de chat en un plan de respuesta, los respondedores reciben las actualizaciones del incidente a través del canal. Pueden interactuar con el incidente directamente desde el canal de chat utilizando comandos de chat.
Con AWS Chatbotél, puede crear un canal para Slack, para Microsoft Teams, o para que Amazon Chime lo utilice en sus planes de respuesta. Para obtener información sobre cómo crear un canal de chat en AWS Chatbot, consulte la Guía del AWS Chatbot administrador.
importante
El administrador de incidentes debe tener permisos para publicar en un tema de Amazon Simple Notification Service (AmazonSNS) de un canal de chat. Sin permisos para publicar en ese SNS tema, no puedes añadirlo al plan de respuesta. Incident Manager publica una notificación de prueba en el SNS tema para verificar los permisos.
Para obtener más información sobre los canales de chat, consulte Creación e integración de canales de chat para el personal de respuesta en Incident Manager.
Para especificar un canal de chat de respuesta a incidentes
-
En el canal de chat, seleccione un canal de AWS Chatbot chat en el que los socorristas puedan comunicarse durante un incidente.
sugerencia
Para crear un nuevo canal de chat en AWS Chatbot, selecciona Configurar nuevo cliente de Chatbot.
-
Para los SNStemas del canal de chat, elige SNS temas adicionales para publicarlos durante el incidente. Añadir SNS temas en varios grupos Regiones de AWS aumenta la redundancia en caso de que una región esté inactiva en el momento del incidente.
-
Realice a continuación la Selección de contactos, horarios de guardia y planes de escalada que se activarán durante un incidente.
(Opcional) Selección de recursos que se activarán en una respuesta a incidentes
Es importante identificar a los respondedores más apropiados al producirse un incidente. Como práctica recomendada, le sugerimos que haga lo siguiente:
-
Añada contactos y horarios de guardia como los canales de escalada en un plan de escalada.
-
Elija un plan de escalada como compromiso en un plan de respuesta.
Para obtener más información sobre contactos y planes de escalada, consulte Creación y configuración de contactos en Incident Manager y Creación de un plan de escalamiento para la participación del personal de respuesta en Incident Manager.
Para seleccionar los recursos por involucrar en la respuesta a incidentes
-
En Participaciones, elija cualquier número de planes de escalada, programas de guardia y contactos individuales.
-
Como opción, realice a continuación la Especificación de un manual de procedimientos para ejecutar como parte de su mitigación de incidentes.
(Opcional) Especificación de un manual de procedimientos para mitigación de incidentes
Puede usar los manuales de AWS Systems Manager automatización, una capacidad de AWS Systems Manager, para automatizar las tareas comunes de aplicaciones e infraestructura en su Nube de AWS entorno.
Cada manual de procedimientos define un flujo de trabajo del manual de procedimientos. Un flujo de trabajo manual incluye las acciones que Systems Manager realiza en los nodos gestionados u otros tipos de AWS recursos. En Incident Manager, un manual de procedimientos administra la respuesta y mitigación de incidentes.
Para obtener más información sobre el uso de manuales de procedimientos en los planes de respuesta, consulte Integración de los manuales de automatización de Systems Manager en Incident Manager para la solución de incidentes.
Para especificar un manual de procedimientos para mitigación de incidentes:
-
En Manual de procedimientos, realice una de las siguientes acciones:
-
Elija Clonar manual de procedimientos de una plantilla para hacer una copia del manual de procedimientos predeterminado de Incident Manager. En Nombre, introduzca un nombre descriptivo para el nuevo manual de procedimientos.
-
Elija Seleccionar manual de procedimientos existente. Seleccione el Propietario, el Manual de procedimientos y la Versión que desee utilizar.
sugerencia
Para crear un manual de procedimientos desde cero, elija Configurar nuevo manual de procedimientos.
Para obtener más información acerca de la creación de manuales de procedimientos, consulte Integración de los manuales de automatización de Systems Manager en Incident Manager para la solución de incidentes.
-
-
En el área Parámetros, introduzca los parámetros solicitados para el manual de procedimientos que haya seleccionado.
Los parámetros disponibles son los especificados por el manual de procedimientos. Un manual de procedimientos podría requerir parámetros distintos a los de otro manual. Algunos parámetros podrían ser obligatorios y otros opcionales.
En muchos casos, puedes optar por introducir manualmente un valor estático para un parámetro, como una lista de EC2 instancias de AmazonIDs. También puede permitir que Incident Manager proporcione los valores de los parámetros generados dinámicamente por un incidente.
-
(Opcional) Para AutomationAssumeRole, especifique la función AWS Identity and Access Management (IAM) que se va a utilizar. Este rol debe tener los permisos necesarios para ejecutar los comandos individuales especificados dentro del manual de procedimientos.
nota
Si no se especifica
AssumeRole
, Incident Manager intentará utilizar el rol de servicio del manual de procedimientos para ejecutar los comandos individuales especificados dentro del manual de procedimientos.Elija una de las siguientes opciones:
-
Introducir ARN valor: introduce manualmente el nombre de recurso de Amazon (ARN) de un AssumeRole, en el formato
arn:aws:iam::
. Por ejemplo,account-id
:role/assume-role-name
arn:aws:iam::123456789012:role/MyAssumeRole
. -
Utilizar un rol de servicio existente: elija un rol con los permisos requeridos de una lista de roles existentes en su cuenta.
-
Cree un nuevo rol de servicio: elija entre las políticas AWS gestionadas para adjuntarlas a su perfil AssumeRole. Tras seleccionar esta opción, en Políticas administradas de AWS , elija una o más políticas en la lista.
Puede aceptar el nombre predeterminado sugerido para el nuevo rol o introducir uno que usted elija.
nota
Este nuevo rol de servicio del manual de procedimientos está asociado con el manual de procedimientos específico que haya seleccionado. No se puede utilizar con manuales de procedimientos diferentes. Esto se debe a que la sección de recursos de la política no admite otros manuales de procedimientos.
-
-
En el caso del rol de servicio Runbook, especifique el IAM rol que se utilizará para proporcionar los permisos necesarios para acceder e iniciar el flujo de trabajo del propio runbook.
Como mínimo, el rol debe permitir la acción
ssm:StartAutomationExecution
para su manual de procedimientos específico. Para que el manual de procedimientos funcione en todas las cuentas, el rol también debe permitir la acciónsts:AssumeRole
para el rolAWS-SystemsManager-AutomationExecutionRole
que creó durante Gestión de incidentes en todas Cuentas de AWS las regiones en Incident Manager.Elija una de las siguientes opciones:
-
Crear nuevo rol de servicio: Incident Manager crea un rol de servicio del manual de procesimientos para usted que incluye los permisos mínimos necesarios para iniciar el flujo de trabajo del manual de procedimientos.
En Nombre del rol, puede aceptar el nombre predeterminado sugerido o introducir uno que usted elija. Le recomendamos que utilice el nombre sugerido o que mantenga el nombre del manual de procedimientos en el nombre. Esto se debe a que el nuevo AssumeRole está asociado al manual específico que ha seleccionado y es posible que no incluya los permisos necesarios para otros manuales.
-
Utilice el rol de servicio existente: un IAM rol que usted o Incident Manager hayan creado anteriormente otorga los permisos necesarios.
En Nombre del rol, seleccione el nombre del rol existente que desee utilizar.
-
-
Expanda las opciones adicionales y elija una de las siguientes opciones para especificar Cuenta de AWS dónde debe ejecutarse el flujo de trabajo del manual.
-
Cuenta del propietario del plan de respuesta: inicie el flujo de trabajo del manual en la cuenta en la Cuenta de AWS que lo creó.
-
Cuenta afectada: inicie el flujo de trabajo del manual de procedimientos en la cuenta que inició o notificó el incidente.
Elija Cuenta afectada cuando utilice Incident Manager para escenarios entre cuentas y el manual de procedimientos necesite acceder a los recursos de la cuenta afectada para corregirlos.
-
-
Continúe integrando opcionalmente un PagerDuty servicio en el plan de respuesta.
(Opcional) Integrar un PagerDuty servicio en el plan de respuesta
Para integrar un PagerDuty servicio en el plan de respuesta
Al integrar Incident Manager con PagerDuty, PagerDuty crea el incidente correspondiente cada vez que Incident Manager crea un incidente. El incidente PagerDuty utiliza el flujo de trabajo de paginación y las políticas de escalamiento que usted definió allí, además de las de Incident Manager. PagerDuty adjunta los eventos de la cronología de Incident Manager como notas sobre el incidente.
-
Amplíe las integraciones de terceros y, a continuación, active la casilla Habilitar PagerDuty la integración.
-
En Seleccionar secreto, selecciona el secreto en el AWS Secrets Manager que guardas las credenciales para acceder a tu PagerDuty cuenta.
Para obtener información sobre cómo almacenar sus PagerDuty credenciales en un secreto de Secrets Manager, consulteAlmacenar las credenciales de PagerDuty acceso en AWS Secrets Manager secreto.
-
Para el PagerDuty servicio, seleccione el servicio de su PagerDuty cuenta en el que desee crear el PagerDuty incidente.
-
Realice a continuación la Adición de etiquetas opcionales y creación del plan de respuesta.
Adición de etiquetas y creación del plan de respuesta
Para añadir etiquetas y crear el plan de respuesta
-
(Opcional) En el área Etiquetas, aplique uno o más pares de nombre-valor de claves de etiqueta al plan de respuesta.
Las etiquetas son metadatos opcionales que usted asigna a un recurso. Con las etiquetas, puede categorizar un recurso de diferentes maneras, como por propósito, propietario o entorno. Por ejemplo, es posible que desee etiquetar un plan de respuesta para identificar el tipo de incidente que debe mitigar, los tipos de canales de escalada que contiene o el plan de escalada que se le asociará. Para obtener más información sobre el etiquetado de recursos de Incident Manager, consulte Etiquetado de recursos en Administración de incidentes.
-
Elija Crear plan de respuesta.