Configuración de la recuperación basada en acciones de CloudWatch - Amazon Elastic Compute Cloud

Configuración de la recuperación basada en acciones de CloudWatch

importante
  • La siguiente información se aplica a la configuración de las capacidades relacionadas con la recuperación en instancias en buen estado. Si actualmente tiene dificultades para acceder a su instancia, consulte Solucionar problemas de instancias de EC2.

  • Para que la carga de trabajo funcione correctamente tras una recuperación correcta, la instancia debe arrancar y aceptar el tráfico sin necesidad de intervención manual.

Puede configurar la recuperación basada en acciones de Amazon CloudWatch para añadir acciones de recuperación a las alarmas de Amazon CloudWatch. La recuperación basada en acciones de CloudWatch funciona con la métrica de StatusCheckFailed_System. La recuperación basada en acciones de CloudWatch informa con precisión la granularidad de los tiempos de respuesta de la recuperación y envía notificaciones de Amazon Simple Notification Service (Amazon SNS) sobre las acciones y los resultados de recuperación. Estas opciones de configuración permiten intentar recuperar las instancias con mayor rapidez y con un control más preciso de la respuesta a los eventos de error en la comprobación del estado del sistema en comparación con la recuperación automática simplificada. Para obtener más información sobre las opciones de CloudWatch disponibles, consulte Comprobaciones de estado para sus instancias.

La recuperación basada en acciones de Amazon CloudWatch no funciona durante los eventos de servicio en el AWS Health Dashboard. Para obtener más información, consulte Solución de problemas durante la recuperación basada en acciones de Amazon CloudWatch.

Requisitos y limitaciones de la recuperación basada en acciones de CloudWatch

La recuperación basada en acciones de CloudWatch puede intentar recuperar una instancia si esta:

  • Está en estado de running. Para obtener más información, consulte Ciclo de vida de la instancia.

  • Usa la tenencia de instancia default (bajo demanda) o dedicated. Para obtener más información, consulte Opciones de compra de instancias.

  • Es de un tipo de instancia para el que Amazon EC2 tiene capacidad disponible. En algunas situaciones, como las interrupciones importantes, no habrá capacidad suficiente disponible y es posible que algunos intentos de recuperación fallen.

  • No usa la tenencia de instancias dedicated. En el caso de los hosts dedicados de Amazon EC2, puede utilizar la recuperación automática de hosts dedicados para recuperar automáticamente las instancias en mal estado.

  • No usa un dispositivo Elastic Fabric Adapter.

  • No forma parte de un grupo de escalado automático.

  • No se encuentra actualmente en proceso de mantenimiento programado.

  • Usa uno de los siguientes tipos de instancia:

    • De uso general: A1 | M3 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | M6in | M7a | M7g | M7i | M7i-flex | T1 | T2 | T3 | T3a | T4g

    • Optimizadas para la computación: C3 | C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | C6in | C7a | C7g | C7gn | C7i | C7i-flex

    • Optimizadas para memoria: R3 | R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | R6in | R7a | R7g | R7i | R7iz | u-3tb1 | u-6tb1 | u-9tb1 | u-12tb1 | u-18tb1 | u-24tb1 | u7i-12tb | u7in-16tb | u7in-24tb | u7in-32tb | X1 | X1e | X2iezn

    • De computación acelerada: G3 | G3s | G5g | Inf1 | P2 | P3 | VT1

    • De computación de alto rendimiento Hpc6a | Hpc7a | Hpc7g

    • Instancias metal: cualquiera de los tipos anteriores que tengan el tamaño de instancia metal.

  • Tiene volúmenes de almacén de instancias y usa uno de los siguientes tipos de instancia: M3 | C3 | R3 | X1 | X1e | X2idn | X2iedn

aviso

Le recomendamos que cree copias de seguridad de los datos valiosos con regularidad. Para obtener información sobre las prácticas recomendadas en cuanto a las copias de seguridad y la recuperación para Amazon EC2, consulte las Prácticas recomendadas de Amazon EC2.

También puede utilizar la AWS Management Console o la AWS CLI para ver los tipos de instancias que son compatibles con la recuperación basada en acciones de CloudWatch.

Console
Para ver los tipos de instancias que admiten la recuperación basada en acciones de Amazon CloudWatch
  1. Abra la consola de Amazon EC2 en https://console.aws.amazon.com/ec2/.

  2. En el panel de navegación izquierdo, elija Instance Types (Tipos de instancias).

  3. En la barra de filtros, ingrese Auto Recovery support: true (Compatibilidad con la recuperación automática: verdadero). Como alternativa, a medida que ingrese los caracteres y aparezca el nombre del filtro, podrá seleccionarlo.

    La tabla de Tipos de instancias muestra todos los tipos de instancias que admiten la recuperación basada en acciones de Amazon CloudWatch.

AWS CLI
Para ver los tipos de instancias que admiten la recuperación basada en acciones de Amazon CloudWatch

Utilice el comando describe-instance-types.

aws ec2 describe-instance-types --filters Name=auto-recovery-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort

Configuración de la recuperación basada en acciones de CloudWatch

La recuperación basada en acciones de CloudWatch funciona con la métrica de StatusCheckFailed_System. La recuperación basada en acciones de CloudWatch se configura mediante la consola de CloudWatch. Para configurar la recuperación basada en acciones de CloudWatch, consulte Adding recover actions to CloudWatch alarms en la Guía del usuario de Amazon CloudWatch.

Solución de problemas durante la recuperación basada en acciones de Amazon CloudWatch

Los siguientes problemas pueden hacer que se produzca un error en la recuperación de instancias con CloudWatch:

  • La recuperación basada en acciones de CloudWatch no funciona durante los eventos de servicio en el AWS Health Dashboard. Es posible que no reciba notificaciones de error de recuperación de dichos eventos. Para obtener las últimas novedades sobre la disponibilidad del servicio, consulte la página de Estado del servicio.

  • Capacidad temporal insuficiente de hardware de sustitución.

  • La instancia ha alcanzado el límite máximo diario de tres intentos de recuperación. La instancia puede ser retirada si la recuperación automática da error y se determina que una degradación de hardware es la causa del error de comprobación de estado del sistema.

Si el error de comprobación del estado del sistema de la instancia continúa a pesar de haber hecho varios intentos de recuperarla, consulte Solucionar problemas de las instancias con comprobaciones de estado no superadas para obtener más información.