Requisitos Configurar a recuperação baseada em ações do CloudWatch Solução de problemas

Configurar recuperação baseada em ação do CloudWatch em uma instância do EC2

Importante

Esta seção descreve como configurar proativamente os mecanismos de recuperação em uma instância do EC2. Esses mecanismos de recuperação são projetados para restaurar a disponibilidade da instância quando a AWS detecta um problema subjacente de hardware ou software que faz com que a verificação de status do sistema falhe. Se você estiver tendo problemas para acessar sua instância, consulte Solução de problemas de instâncias do EC2.

Se o AWS detectar que uma instância está indisponível devido a um problema subjacente de hardware ou software, a recuperação baseada em ações do CloudWatch pode restaurar automaticamente a disponibilidade da instância movendo-a do host com o problema subjacente para um host diferente.

Se a recuperação baseada em ações do CloudWatch ocorrer, a AWS enviará um dos eventos a seguir para o seu AWS Health Dashboard, dependendo do resultado:

Evento de êxito: AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS
Evento de falha: AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE

É possível configurar a recuperação baseada em ações do CloudWatch para adicionar ações de recuperação aos alarmes do Amazon CloudWatch. A recuperação baseada em ações do CloudWatch funciona com a métrica StatusCheckFailed_System. A recuperação baseada em ações do CloudWatch fornece granularidade de tempo de resposta de recuperação a cada minuto e notificações do Amazon Simple Notification Service (Amazon SNS) sobre as ações e os resultados da recuperação. Essas opções de configuração permitem tentativas de recuperação mais rápidas com controle mais granular sobre a resposta do evento de falha na verificação de status do sistema em comparação com a recuperação automática simplificada. Para obter mais informações sobre as opções disponíveis do CloudWatch, consulte Verificações de status para as instâncias.

No entanto, a recuperação baseada em ações do CloudWatch só pode operar se uma instância estiver no estado running, se não houver eventos de serviço listados no AWS Health Dashboard, e se houver capacidade disponível para o tipo de instância. Em algumas situações, como interrupções significativas, restrições de capacidade podem causar falhas nas tentativas de recuperação. Para obter mais informações, consulte Solução de problemas de falha da recuperação baseada em ações do CloudWatch.

Atenção

Quando a AWS recupera sua instância devido a um problema subjacente de hardware ou software, esteja ciente das seguintes consequências: os dados armazenados na memória volátil (RAM) e nos volumes de armazenamento de instância serão perdidos, e o tempo de atividade do sistema operacional recomeçará do zero. Para ajudar a se proteger contra a perda de dados, recomendamos que você crie regularmente backups de dados importantes. Para obter mais informações sobre as práticas recomendadas de backup e recuperação de instâncias do EC2, consulte Práticas recomendadas do Amazon EC2.

Os mecanismos automáticos de recuperação de instâncias são projetados para instâncias individuais. Para obter orientação sobre como criar um sistema resiliente, consulte Crie um sistema resiliente.

Conteúdo

Requisitos para a habilitação da recuperação baseada em ações do CloudWatch
Configurar a recuperação baseada em ações do CloudWatch
Solução de problemas de falha da recuperação baseada em ações do CloudWatch

Requisitos para a habilitação da recuperação baseada em ações do CloudWatch

A recuperação baseada em ações do CloudWatch pode ser habilitada em instâncias que atendam aos critérios a seguir:

Tipos de instância

Uso geral: A1, M3, M4, M5, M5a, M5n, M5zn, M6a, M6g, M6i, M6in, M7a, M7g, M7i, M7i-flex, M8a, M8azn, M8g, M8gb, M8gn, M8i, M8i-flex, M8in, M8ine, M8ib, M9g, T1, T2, T3, T3a, T4g
Otimizadas para computação: C3, C4, C5, C5a, C5n, C6a, C6g, C6gn, C6i, C6in, C7a, C7g, C7gn, C7i, C7i-flex, C8a, C8g, C8gb, C8gn, C8i, C8i-flex, C8in, C8ine, C8ib, C9g
Otimizadas para memória: R3, R4, R5, R5a, R5b, R5n, R6a, R6g, R6i, R6in, R7a, R7g, R7i, R7iz, R8a, R8g, R8gb, R8gn, R8i, R8i-flex, R8in, R8ib, U-3tb1, U-6tb1, U-9tb1, U-12tb1, U-18tb1, U-24tb1, U7i-6tb, U7i-8tb, U7i-12tb, U7in-16tb, U7in-24tb, U7in-32tb, U7inh-32tb, X1, X1e, X2idn, X2iedn, X2iezn, X8g, X8i
Computação acelerada: G3, G5g, Inf1, P3, VT1
Computação de alta performance: Hpc6a, Hpc7a, Hpc7g, Hpc8a
Instâncias Metal: qualquer uma das instâncias acima com o tamanho da instância metal.
Se volumes de armazenamento de instância forem adicionados na inicialização: então, há suporte somente para os tipos de instância a seguir: M3, C3, R3, X1, X1e, X2idn, X2iedn

Locação

Compartilhada
Instância Dedicada

Para obter mais informações, consulte Instâncias dedicadas do Amazon EC2.

Limitações

Não há suporte para a recuperação baseada em ações do CloudWatch em instâncias com as características a seguir:

Locação: host dedicado. Para hosts dedicados, use a Recuperação automática de host dedicado em vez disso.
Rede: instâncias usando um adaptador de malha elástica
Ajuste de escala automático: instâncias que fazem parte de um grupo do Auto Scaling
Manutenção: instâncias que estejam passando por um evento de manutenção programada no momento

Encontrar um tipo de instância compatível

É possível visualizar os tipos de instância que oferecem suporte à recuperação baseada em ação do CloudWatch.

Configurar a recuperação baseada em ações do CloudWatch

Para configurar a recuperação baseada em ações do CloudWatch para uma instância do EC2, crie um alarme do CloudWatch que monitore a métrica StatusCheckFailed_System para a instância especificada. Defina o alarme para ser acionado quando o valor da métrica for 1, indicando uma falha na verificação do status do sistema. Configure a ação do alarme para recuperar automaticamente a instância quando acionada.

É possível configurar o alarme usando o console do Amazon EC2 ou o console do CloudWatch. Para obter instruções, consulte Adicionar ações de recuperação a alarmes do Amazon CloudWatch neste guia do usuário, ou Adição de ações de recuperação aos alarmes do Amazon CloudWatch no Guia do usuário do Amazon CloudWatch.

Solução de problemas de falha da recuperação baseada em ações do CloudWatch

Se a recuperação baseada em ações do CloudWatch falhar ao recuperar a sua instância, considere os problemas a seguir:

AWSOs eventos de serviço da estão em execução

A recuperação baseada em ações do CloudWatch não opera durante eventos de serviço no AWS Health Dashboard. Talvez você não receba notificações de falha de recuperação para esses eventos. Para obter as informações mais recentes sobre a disponibilidade do serviço, consulte a página de status do serviço.
Capacidade insuficiente

Há temporariamente hardware de substituição insuficiente para migrar a instância.
Número máximo de tentativas diárias de recuperação atingido

A instância alcançou a franquia diária máxima de tentativas de recuperação. Sua instância poderá ser subsequentemente retirada se a recuperação automática falhar e se for determinado que uma degradação do hardware é a causa-raiz da falha original da verificação do status do sistema.

Se a falha na verificação de status do sistema da instância persistir apesar de várias tentativas de recuperação, consulte Solução de problemas em instâncias com falha nas verificações de status para obter mais informações.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Recuperação automática simplificada

Metadados da instância

Configurar recuperação baseada em ação do CloudWatch em uma instância do EC2

Importante

Atenção

Conteúdo

Requisitos para a habilitação da recuperação baseada em ações do CloudWatch

Encontrar um tipo de instância compatível

Para visualizar os tipos de instância que oferecem suporte à recuperação baseada em ações do CloudWatch

Para visualizar os tipos de instância que oferecem suporte à recuperação baseada em ações do CloudWatch

Para visualizar os tipos de instância que oferecem suporte à recuperação baseada em ações do CloudWatch

Configurar a recuperação baseada em ações do CloudWatch

Solução de problemas de falha da recuperação baseada em ações do CloudWatch