Configurar a recuperação automática simplificada em uma instância do Amazon EC2 - Amazon Elastic Compute Cloud

Configurar a recuperação automática simplificada em uma instância do Amazon EC2

Importante

Esta seção descreve como configurar proativamente os mecanismos de recuperação em uma instância do EC2. Esses mecanismos de recuperação são projetados para restaurar a disponibilidade da instância quando a AWS detecta um problema subjacente de hardware ou software que faz com que a verificação de status do sistema falhe. Se você estiver tendo problemas para acessar sua instância, consulte Solução de problemas de instâncias do EC2.

Se a AWS detectar que uma instância não está disponível devido a um problema subjacente de hardware ou software, a recuperação automática simplificada pode restaurar automaticamente a disponibilidade da instância movendo a instância do host com o problema subjacente para um host diferente.

Se ocorrer uma recuperação automática simplificada, a AWS enviará um dos eventos a seguir ao seu AWS Health Dashboard, dependendo do resultado:

  • Evento de êxito: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS

  • Evento de falha: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE

Para ser notificado sobre esses eventos, é possível configurar as notificações. Para obter mais informações, consulte Criação da sua primeira configuração de notificação no Notificações de Usuários da AWS no Guia do usuário do Notificações de Usuários da AWS. Você também pode usar as regras do Amazon EventBridge para monitorar os eventos de recuperação automática simplificados.

A recuperação automática simplificada é habilitada por padrão em todas as instâncias com suporte durante a execução da instância. No entanto, ela só poderá operar se uma instância estiver no estado running, se não houver eventos de serviço listados no AWS Health Dashboard e se houver capacidade disponível para o tipo de instância. Em algumas situações, como interrupções significativas, restrições de capacidade podem causar falhas nas tentativas de recuperação. Para ter mais informações, consulte Solução de problemas de falhas da recuperação automática simplificada.

É possível desabilitar a recuperação automática simplificada durante ou após o lançamento e reabilitá-la posteriormente, caso necessário.

Atenção

Quando a AWS recupera sua instância de um problema subjacente de hardware ou software, tenha em mente as seguintes consequências: os dados armazenados na memória volátil (RAM) serão perdidos e o tempo de atividade do sistema operacional recomeçará do zero. Para ajudar a se proteger contra a perda de dados, recomendamos que você crie regularmente backups de dados importantes. Para obter mais informações sobre as práticas recomendadas de backup e recuperação de instâncias do EC2, consulte Práticas recomendadas do Amazon EC2.

Os mecanismos automáticos de recuperação de instâncias são projetados para instâncias individuais. Para obter orientação sobre como criar um sistema resiliente, consulte Crie um sistema resiliente.

Requisitos para a habilitação da recuperação automática simplificada

A recuperação automática simplificada pode ser habilitada em instâncias que atendam aos seguintes critérios:

Tipos de instância
  • Uso geral: A1, M3, M4, M5, M5a, M5n, M5zn, M6a, M6g, M6i, M6in, M7a, M7g, M7i, M7i-flex, M8g, T1, T2, T3, T3a, T4g

  • Otimizadas para computação: C3, C4, C5, C5a, C5n, C6a, C6g, C6gn, C6i, C6in, C7a, C7g, C7gn, C7i, C7i-flex, C8g

  • Otimizadas para memória: R3, R4, R5, R5a, R5b, R5n, R6a, R6g, R6i, R6in, R7a, R7g, R7i, R7iz, R8g, U-3tb1, U-6tb1, U-9tb1, U-12tb1, U-18tb1, U-24tb1, U7i-6tb, U7i-8tb, U7i-12tb, U7in-16tb, U7in-24tb, U7in-32tb, U7inh-32tb, X1, X1e, X2iezn, X8g

  • Computação acelerada: G3, G5g, Inf1, P2, P3, VT1

  • Computação de alta performance: Hpc6a, Hpc7a, Hpc7g

Locação
  • Compartilhada

  • Instância Dedicada

Para ter mais informações, consulte Instâncias dedicadas do Amazon EC2.

Limitações

Não há suporte para a recuperação automática simplificada para instâncias com as características a seguir:

  • Tamanho da instância: metal instâncias

  • Locação: host dedicado. Para hosts dedicados, use a recuperação automática de host dedicado em vez disso.

  • Armazenamento: instâncias com volumes de armazenamento de instância

  • Rede: instâncias usando um adaptador de malha elástica

  • Ajuste de escala automático: instâncias que fazem parte de um grupo do Auto Scaling

  • Manutenção: instâncias que estejam passando por um evento de manutenção programada no momento

Configurar a recuperação automática simplificada

A recuperação automática simplificada é ativada por padrão quando você executa uma instância compatível. É possível definir o comportamento de recuperação automática como disabled durante ou após a inicialização da instância.

A configuração default não habilita a recuperação automática simplificada para uma instância sem suporte.

Console
Para desabilitar a recuperação automática simplificada na inicialização da instância
  1. Abra o console do Amazon EC2 em https://console.aws.amazon.com/ec2/.

  2. No painel de navegação, escolha Instances (Instâncias) e Launch Instance (Iniciar instância).

  3. Na seção Detalhes avançados, em Recuperação automática de instâncias, escolha Desabilitado.

  4. Defina as configurações de execução da instância restantes conforme necessário e, em seguida, inicie a instância.

Para desabilitar a recuperação automática simplificada de uma instância em execução ou interrompida
  1. Abra o console do Amazon EC2 em https://console.aws.amazon.com/ec2/.

  2. No painel de navegação, escolha Instances (Instâncias).

  3. Selecione a instância, escolha Actions (Ações), Instance Settings (Configurações da instância) e selecione Change auto-recovery Behavior (Alterar o comportamento da recuperação automática).

  4. Escolha Off (Desativar) e, em seguida, escolha Save (Salvar).

Para habilitar a recuperação automática simplificada de uma instância em execução ou interrompida
  1. Abra o console do Amazon EC2 em https://console.aws.amazon.com/ec2/.

  2. No painel de navegação, escolha Instances (Instâncias).

  3. Selecione a instância, escolha Actions (Ações), Instance Settings (Configurações da instância) e selecione Change auto-recovery Behavior (Alterar o comportamento da recuperação automática).

  4. Escolha Padrão e depois Save (Salvar).

AWS CLI
Para desabilitar a recuperação automática simplificada na inicialização

Use o comando run-instances.

aws ec2 run-instances \ --image-id ami-1a2b3c4d \ --instance-type t2.micro \ --key-name MyKeyPair \ --maintenance-options AutoRecovery=Disabled \ [...]
Para desabilitar a recuperação automática simplificada de uma instância em execução ou interrompida

Use o comando modify-instance-maintenance-options.

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery disabled
Para definir o comportamento de recuperação automática como default para uma instância em execução ou interrompida

Use o comando modify-instance-maintenance-options.

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery default

Solução de problemas de falhas da recuperação automática simplificada

Se a recuperação automática simplificada falhar ao recuperar a sua instância, considere os problemas a seguir:

  • Os eventos de serviço da AWS estão em execução

    A recuperação automática simplificada não opera durante eventos de serviço no AWS Health Dashboard. Talvez você não receba notificações de falha de recuperação para esses eventos. Para obter as informações mais recentes sobre a disponibilidade do serviço, consulte a página de status do serviço.

  • Insufficient capacity (Capacidade insuficiente)

    Há temporariamente hardware de substituição insuficiente para migrar a instância.

  • Número máximo de tentativas diárias de recuperação atingido

    A instância alcançou a franquia diária máxima de tentativas de recuperação. Sua instância poderá ser subsequentemente retirada se a recuperação automática falhar e se for determinado que uma degradação do hardware é a causa-raiz da falha original da verificação do status do sistema.

Se a falha na verificação de status do sistema da instância persistir apesar de várias tentativas de recuperação, consulte Solução de problemas em instâncias com falha nas verificações de status para obter mais informações.