

# Configuración de la recuperación basada en acciones de CloudWatch en una instancia de EC2
<a name="cloudwatch-recovery"></a>

**importante**  
Esta sección describe cómo configurar de forma proactiva los mecanismos de recuperación en una instancia de EC2. Estos mecanismos de recuperación están diseñados para restaurar la disponibilidad de la instancia cuando AWS detecta un problema de hardware o software subyacente que provoca un error en la comprobación del estado del sistema. Si actualmente tiene dificultades para acceder a la instancia, consulte [Solución de problemas con las instancias de EC2](ec2-instance-troubleshoot.md).

Si AWS detecta que una instancia no está disponible debido a un problema de hardware o software subyacente, la *recuperación basada en acciones de CloudWatch* puede restaurar automáticamente la disponibilidad de la instancia mediante el traslado de la instancia del host con el problema subyacente a un host diferente.

Si se produce una recuperación basada en acciones de CloudWatch, AWS envía uno de los siguientes eventos al Panel de AWS Health, según el resultado:
+ Evento correcto: `AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS`
+ Evento de error: `AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE`

Puede configurar la recuperación basada en acciones de CloudWatch para agregar acciones de recuperación a las alarmas de Amazon CloudWatch. La recuperación basada en acciones de CloudWatch funciona con la métrica de `StatusCheckFailed_System`. La recuperación basada en acciones de CloudWatch informa con precisión la granularidad de los tiempos de respuesta de la recuperación y envía notificaciones de Amazon Simple Notification Service (Amazon SNS) sobre las acciones y los resultados de recuperación. Estas opciones de configuración permiten intentar recuperar las instancias con mayor rapidez y con un control más preciso de la respuesta a los eventos de error en la comprobación del estado del sistema en comparación con la recuperación automática simplificada. Para obtener más información sobre las opciones de CloudWatch disponibles, consulte [Comprobaciones de estado para sus instancias](monitoring-system-instance-status-check.md).

Sin embargo, la recuperación basada en acciones de CloudWatch solo puede funcionar si una instancia se encuentra en estado `running`, no hay eventos de servicio enumerados el Panel de AWS Health y hay capacidad disponible para el tipo de instancia. En algunas situaciones, como las interrupciones significativas, las restricciones de capacidad pueden hacer que se produzca un error en los intentos de recuperación. Para obtener más información, consulte [Solución de problemas durante la recuperación basada en acciones de CloudWatch](#ec2-instance-recover-cloudwatch-troubleshooting).

**aviso**  
Cuando AWS recupere la instancia debido a un problema de hardware o software subyacente, tenga en cuenta las siguientes consecuencias: se perderán los datos almacenados en la memoria volátil (RAM) y en los volúmenes de almacenamiento de la instancia, y el tiempo de actividad del sistema operativo comenzará de cero. Para ayudar a evitar la pérdida de datos, le recomendamos que cree copias de seguridad de los datos valiosos con regularidad. Para obtener más información sobre las prácticas recomendadas en cuanto a las copias de seguridad y la recuperación para las instancias de EC2, consulte las [Prácticas recomendadas de Amazon EC2](ec2-best-practices.md).  
Los mecanismos de recuperación automática de instancias están diseñados para *instancias individuales*. Para obtener orientación sobre cómo crear un *sistema* resiliente, consulte [Cree un sistema resiliente](ec2-instance-recover.md#instance-recovery-build-a-resilient-system).

**Topics**
+ [Requisitos para habilitar la recuperación basada en acciones de CloudWatch](#requirements-for-cloudwatch-action-based-recovery)
+ [Configuración de la recuperación basada en acciones de CloudWatch](#ec2-instance-recover-cloudwatch-configure)
+ [Solución de problemas durante la recuperación basada en acciones de CloudWatch](#ec2-instance-recover-cloudwatch-troubleshooting)

## Requisitos para habilitar la recuperación basada en acciones de CloudWatch
<a name="requirements-for-cloudwatch-action-based-recovery"></a>

La recuperación basada en acciones de CloudWatch se puede habilitar en instancias que cumplan los siguientes criterios:

**Tipos de instancias**  
+ **De uso general:** A1, M3, M4, M5, M5a, M5n, M5zn, M6a, M6g, M6i, M6in, M7a, M7g, M7i, M7i-flex, M8a, M8azn, M8g, M8gb, M8gn, M8i, M8i-flex, T1, T2, T3, T3a, T4g
+ **Optimizadas para la computación:** C3, C4, C5, C5a, C5n, C6a, C6g, C6gn, C6i, C6in, C7a, C7g, C7gn, C7i, C7i-flex, C8a, C8g, C8gb, C8gn, C8i, C8i-flex
+ **Optimizadas para la memoria:** R3, R4, R5, R5a, R5b, R5n, R6a, R6g, R6i, R6in, R7a, R7g, R7i, R7iz, R8a, R8g, R8gb, R8gn, R8i, R8i-flex, U-3tb1, U-6tb1, U-9tb1, U-12tb1, U-18tb1, U-24tb1, U7i-6tb, U7i-8tb, U7i-12tb, U7in-16tb, U7in-24tb, U7in-32tb, U7inh-32tb, X1, X1e, X2idn, X2iedn, X2iezn, X8g, X8i 
+ **Computación acelerada:** G3, G5g, Inf1, P3, VT1
+ **De computación de alto rendimiento:** Hpc6a, Hpc7a, Hpc7g, Hpc8a
+ **Instancias metal**: cualquiera de los tipos de instancias anteriores que tengan el tamaño de instancia metal.
+ **Si se agregan volúmenes de almacén de instancias durante la inicialización:** solo son compatibles los siguientes tipos de instancias: M3, C3, R3, X1, X1e, X2idn, X2iedn 

**Propiedad**  
+ Compartida
+ Dedicated Instance
Para obtener más información, consulte [Instancias dedicadas de Amazon EC2](dedicated-instance.md).

**Limitaciones**

La recuperación basada en acciones de CloudWatch no es compatible con una instancia que tenga las siguientes características:
+ Tenencia: host dedicado. En el caso de los hosts dedicados, utilice la [Recuperación automática del host dedicado](dedicated-hosts-recovery.md) en su lugar.
+ Redes: instancias que usan un Elastic Fabric Adapter
+ Escalado automático: instancias que forman parte de un grupo de escalado automático
+ Mantenimiento: instancias que actualmente se encuentran en proceso de mantenimiento programado

### Búsqueda de un tipo de instancia admitido
<a name="cloudwatch-recovery-find-instance-types"></a>

Puede ver los tipos de instancias que admiten la recuperación basada en acciones de CloudWatch.

------
#### [ Console ]

**Para ver los tipos de instancias que admiten la recuperación basada en acciones de CloudWatch**

1. Abra la consola de Amazon EC2 en [https://console.aws.amazon.com/ec2/](https://console.aws.amazon.com/ec2/).

1. En el panel de navegación izquierdo, elija **Instance Types** (Tipos de instancias).

1. En la barra de filtros, agregue el filtro **Auto Recovery support = true**. La tabla de **Tipos de instancias** muestra todos los tipos de instancias que admiten la recuperación basada en acciones de CloudWatch.

1. (Opcional) Agregue filtros para ampliar el alcance de los tipos de instancias específicos que le interesen.

------
#### [ AWS CLI ]

**Para ver los tipos de instancias que admiten la recuperación basada en acciones de CloudWatch**  
Utilice el comando [describe-instance-types](https://docs.aws.amazon.com/cli/latest/reference/ec2/describe-instance-types.html) con el filtro `auto-recovery-supported`.

```
aws ec2 describe-instance-types \
    --filters Name=auto-recovery-supported,Values=true \
    --query "InstanceTypes[*].[InstanceType]" \
    --output text | sort
```

------
#### [ PowerShell ]

**Para ver los tipos de instancias que admiten la recuperación basada en acciones de CloudWatch**  
Utilice el cmdlet [Get-EC2InstanceType](https://docs.aws.amazon.com/powershell/latest/reference/items/Get-EC2InstanceType.html) con el filtro `auto-recovery-supported`.

```
Get-EC2InstanceType `
    -Filter @{Name="auto-recovery-supported";Values="true"} | `
    Select InstanceType | Sort-Object InstanceType
```

------

## Configuración de la recuperación basada en acciones de CloudWatch
<a name="ec2-instance-recover-cloudwatch-configure"></a>

Para configurar la recuperación basada en acciones de CloudWatch para una instancia de EC2, cree una alarma de CloudWatch que supervise la métrica de `StatusCheckFailed_System` de la instancia especificada. Configure la alarma para que se active cuando el valor de la métrica sea **1**, lo que indica que se ha producido un error en la comprobación del estado del sistema. Configure la acción de alarma para recuperar automáticamente la instancia cuando se active.

Puede configurar la alarma mediante la consola de Amazon EC2 o la consola de CloudWatch. Para obtener las instrucciones, consulte [Agregar acciones de recuperación a alarmas de Amazon CloudWatch](UsingAlarmActions.md#AddingRecoverActions) en esta guía del usuario o [Cómo agregar acciones de recuperación a las alarmas de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/UsingAlarmActions.html#AddingRecoverActions) en la *Guía del usuario de Amazon CloudWatch*.

## Solución de problemas durante la recuperación basada en acciones de CloudWatch
<a name="ec2-instance-recover-cloudwatch-troubleshooting"></a>

Si la recuperación basada en acciones de CloudWatch no consigue recuperar la instancia, tenga en cuenta los siguientes problemas:
+ Eventos del servicio de AWS se encuentran en ejecución

  La recuperación basada en acciones de CloudWatch no funciona durante los eventos de servicio en el Panel de AWS Health. Es posible que no reciba notificaciones de error de recuperación de dichos eventos. Para obtener las últimas novedades sobre la disponibilidad del servicio, consulte la página de [Estado del servicio](https://health.aws.amazon.com/health/status).
+ Capacidad insuficiente

  Actualmente, no hay suficiente hardware de reemplazo disponible para migrar la instancia.
+ Se ha alcanzado la cantidad máxima de intentos de recuperación diarios

  La instancia ha alcanzado el límite máximo diario de tres intentos de recuperación. Es posible que la instancia sea retirada posteriormente si falla la recuperación automática y se determina que una degradación del hardware es la causa principal del fallo original en la comprobación del estado del sistema.

Si el error de comprobación del estado del sistema de la instancia continúa a pesar de haber hecho varios intentos de recuperarla, consulte [Solucionar problemas de las instancias con comprobaciones de estado no superadas](TroubleshootingInstances.md) para obtener más información.