Configurar a recuperação baseada em ação do CloudWatch - Amazon Elastic Compute Cloud

Configurar a recuperação baseada em ação do CloudWatch

Importante
  • As informações a seguir se aplicam à configuração de recursos relacionados à recuperação em instâncias íntegras. Se você está enfrentando dificuldades para acessar sua instância, consulte Solucionar problemas de instâncias do EC2.

  • Para que sua workload funcione adequadamente após uma recuperação bem-sucedida da instância, sua instância deve inicializar e aceitar o tráfego sem exigir intervenção manual.

Você pode configurar a recuperação baseada em ações do Amazon CloudWatch para adicionar ações de recuperação aos alarmes do Amazon CloudWatch. A recuperação baseada em ações do CloudWatch funciona com a métrica StatusCheckFailed_System. A recuperação baseada em ações do CloudWatch fornece granularidade de tempo de resposta de recuperação a cada minuto e notificações do Amazon Simple Notification Service (Amazon SNS) sobre as ações e os resultados da recuperação. Essas opções de configuração permitem tentativas de recuperação mais rápidas com controle mais granular sobre a resposta do evento de falha na verificação de status do sistema em comparação com a recuperação automática simplificada. Para obter mais informações sobre as opções disponíveis do CloudWatch, consulte Verificações de status para as instâncias.

A recuperação baseada em ações do Amazon CloudWatch não opera durante eventos de serviço no AWS Health Dashboard. Para ter mais informações, consulte Solucionar problemas de falha de recuperação baseada em ações do CloudWatch.

Requisitos e limitações da recuperação baseada em ações do CloudWatch

A recuperação baseada em ações do CloudWatch poderá tentar recuperar uma instância se:

  • Estiver no estado running. Para ter mais informações, consulte Alterações do estado de instâncias do Amazon EC2.

  • Ela usar default (sob demanda) ou locação de instâncias dedicated. Para ter mais informações, consulte Opções de faturamento e compra do Amazon EC2.

  • For do tipo de instância para o qual o Amazon EC2 tem capacidade disponível. Em algumas situações, como interrupções significativas, não haverá capacidade suficiente, e algumas tentativas de recuperação poderão falhar.

  • Não usa locação de instâncias host. Nos hosts dedicados do Amazon EC2, você pode usar a Recuperação automática de host dedicado para recuperar automaticamente as instâncias que não estão íntegras.

  • Não usa um Elastic Fabric Adaptor.

  • Não é um membro de um grupo do Auto Scaling.

  • No momento, não está passando por um evento de manutenção programado.

  • Usa um dos seguintes tipos de instância:

    • Uso geral: A1 | M3 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | M6in | M7a | M7g | M7i | M7i-flex | M8g | T1 | T2 | T3 | T3a | T4g

    • Otimizadas para computação: C3 | C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | C6in | C7a | C7g | C7gn | C7i | C7i-flex | C8g

    • Otimizada para memória: R3 | R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | R6in | R7a | R7g | R7i | R7iz | R8g | u-3tb1 | u-6tb1 | u-9tb1 | u-12tb1 | u-18tb1 | u-24tb1 | u7i-12tb | u7in-16tb | u7in-24tb | u7in-32tb | X1 | X1e | X2iezn | X8g

    • Computação acelerada: G3 | G3s | G5g | Inf1 | P2 | P3 | VT1

    • Computação de alta performance: Hpc6a | Hpc7a | Hpc7g

    • Instâncias de metal: qualquer um dos tipos acima com o tamanho da instância de metal.

  • Tem volumes de armazenamento de instância e usa um dos seguintes tipos de instância: M3 | C3 | R3 | X1 | X1e | X2idn | X2iedn

Atenção
  • Os dados nos volumes de armazenamento de instância serão perdidos quando a instância for interrompida. Para obter mais informações sobre como interromper uma instância, consulte Instâncias interrompidas.

  • No caso de uma falha na verificação do status do sistema, os dados de armazenamento de instância e mapeamento de dispositivos de blocos podem ser perdidos. Para esses tipos de instância, você pode considerar usar Habilitar a proteção contra encerramento.

Recomendamos que você crie regularmente backups de dados importantes. Para obter informações sobre as melhores práticas de backup e recuperação do Amazon EC2, consulte Melhores práticas do Amazon EC2.

Também é possível usar o AWS Management Console ou a AWS CLI para visualizar os tipos de instância compatíveis com a recuperação baseada em ação do CloudWatch.

Console
Como visualizar os tipos de instância que oferecem suporte à recuperação baseada em ação do Amazon CloudWatch
  1. Abra o console do Amazon EC2 em https://console.aws.amazon.com/ec2/.

  2. No painel de navegação à esquerda, escolha Instances (Instâncias).

  3. Na barra de filtros, insira Auto Recovery support: true (Suporte para Recuperação Automática: true). Como alternativa, à medida que você insere os caracteres e o nome do filtro aparece, é possível selecioná-lo.

    A tabela de tipos de instância exibe todos os tipos de instância que oferecem suporte à recuperação baseada em ação do Amazon CloudWatch.

AWS CLI
Como visualizar os tipos de instância que oferecem suporte à recuperação baseada em ação do Amazon CloudWatch

Use o comando describe-instance-types.

aws ec2 describe-instance-types --filters Name=auto-recovery-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort

Configurar a recuperação baseada em ação do CloudWatch

A recuperação baseada em ações do CloudWatch funciona com a métrica StatusCheckFailed_System. A recuperação baseada em ações do CloudWatch é configurada no console do CloudWatch. Para configurar a recuperação baseada em ações do CloudWatch, consulte Adding recover actions to CloudWatch alarms no Guia do usuário do Amazon CloudWatch.

Solucionar problemas de falha de recuperação baseada em ações do CloudWatch

Os problemas a seguir podem fazer com que a recuperação da instância com uma recuperação baseada em ações do CloudWatch falhe:

  • A recuperação baseada em ações do CloudWatch não opera durante eventos de serviço no AWS Health Dashboard. Talvez você não receba notificações de falha de recuperação para esses eventos. Para obter as informações mais recentes sobre a disponibilidade do serviço, consulte a página status do serviço.

  • Capacidade temporária e insuficiente do hardware de substituição.

  • A instância alcançou a franquia diária máxima de tentativas de recuperação. Sua instância poderá ser subsequentemente retirada se a recuperação automática falhar e se for determinado que a degradação do hardware é a causa-raiz da falha de verificação do status do sistema original.

Se a falha na verificação de status do sistema da instância persistir apesar de várias tentativas de recuperação, consulte Solução de problemas em instâncias com falha nas verificações de status para obter mais informações.