REL10-BP02 Selecionar os locais apropriados para sua implantação de vários locais - Pilar Confiabilidade

REL10-BP02 Selecionar os locais apropriados para sua implantação de vários locais

Resultado desejado: para alta disponibilidade, sempre (que possível) implante os componentes da workload em várias zonas de disponibilidade (AZs). Para workloads com requisitos de resiliência extrema, avalie cuidadosamente as opções para uma arquitetura multirregiões.

Diagrama que mostra uma implantação resiliente de banco de dados Multi-AZ com backup em outra região da AWS

Uma implantação resiliente de banco de dados Multi-AZ com backup em outra região da AWS

Práticas comuns que devem ser evitadas:

  • Optar por projetar uma arquitetura multirregiões quando uma arquitetura Multi-AZ é suficiente para satisfazer os requisitos.

  • Não contabilizar as dependências entre os componentes da aplicação se os requisitos de resiliência e de vários locais são diferentes entre esses componentes.

Benefícios de implementar esta prática recomendada: para fins de resiliência, empregue uma abordagem que crie camadas de defesa. Uma camada protege contra interrupções menores e mais comuns criando uma arquitetura altamente disponível usando várias AZs. Outra camada de defesa destina-se a proteger contra eventos raros, como desastres naturais generalizados e interrupções em nível regional. Essa segunda camada envolve arquitetar a aplicação para abranger várias Regiões da AWS.

  • A diferença entre uma disponibilidade de 99,5% e uma disponibilidade de 99,99% é superior a 3,5 horas por mês. A disponibilidade esperada de uma workload só pode chegar a "quatro noves" se ela estiver em várias AZs.

  • Ao executar sua workload em várias AZs, você pode isolar falhas de energia, resfriamento e rede, bem como a maioria dos desastres naturais, como incêndios e inundações.

  • A implementação de uma estratégia multirregiões para a workload ajuda a protegê-la contra desastres naturais generalizados, que afetam uma grande área geográfica de um país, ou falhas técnicas de escopo regional. Esteja ciente de que a implementação de uma arquitetura multirregiões pode ser complexa e, geralmente, não é necessária para a maioria das workloads.

Nível de risco exposto se esta prática recomendada não for estabelecida: Alto

Orientação para implementação

Para um evento de desastre baseado na interrupção ou perda parcial de uma zona de disponibilidade, implementar uma workload altamente disponível em várias zonas de disponibilidade em uma única Região da AWS ajuda a mitigar desastres naturais e técnicos. Cada Região da AWS é composta por várias zonas de disponibilidade, cada uma isolada de falhas nas outras zonas. No entanto, para um evento de desastre que inclua o risco de perder vários componentes da zona de disponibilidade, que estão a uma distância significativa um do outro, você deve implementar opções de recuperação de desastres para mitigar falhas de âmbito regional. Para workloads que exigem extrema resiliência (infraestrutura crítica, aplicações relacionadas à saúde, infraestrutura do sistema financeiro etc.), uma estratégia multirregiões pode ser necessária.

Etapas de implementação

  1. Avalie sua workload e determine se as necessidades de resiliência podem ser atendidas por uma abordagem Multi-AZ (Região da AWS única) ou se elas exigem uma abordagem multirregiões. A implementação de uma arquitetura multirregiões para satisfazer esses requisitos introduzirá complexidade adicional, portanto, considere cuidadosamente seu caso de uso e seus requisitos. Os requisitos de resiliência quase sempre podem ser atendidos com uma única Região da AWS. Considere os seguintes requisitos possíveis ao determinar se você precisa usar várias regiões:

    1. Recuperação de desastres (DR): para um evento de desastre baseado em interrupção ou perda parcial de uma zona de disponibilidade, implementar uma workload altamente disponível em várias zonas de disponibilidade em uma única Região da AWS ajuda a mitigar desastres naturais e técnicos. Para um evento de desastre que inclua o risco de perda de vários componentes da zona de disponibilidade que estão a uma distância significativa um do outro, você deve implementar a recuperação de desastres em várias regiões para mitigar desastres naturais ou falhas técnicas de âmbito regional.

    2. Alta disponibilidade (HA): uma arquitetura multirregiões (com várias AZs em cada região) pode ser usada para obter mais de quatro noves (> 99,99%) de disponibilidade.

    3. Localização de pilhas: ao implantar uma workload para um público global, você pode implantar pilhas localizadas em diferentes Regiões da AWS para atender ao público nessas regiões. A localização pode incluir idioma, moeda e tipos de dados armazenados.

    4. Proximidade com os usuários: ao implantar uma workload para um público global, você pode reduzir a latência implantando pilhas Regiões da AWS perto de onde os usuários finais estão.

    5. Residência de dados: algumas workloads estão sujeitas aos requisitos de residência de dados, em que os dados de determinados usuários devem permanecer dentro das fronteiras de um país específico. Com base na regulamentação em questão, você pode optar por implantar uma pilha inteira, ou apenas os dados, em uma Região da AWS dentro dessas fronteiras.

  2. Veja a seguir alguns exemplos da funcionalidade Multi-AZ fornecida pelos serviços da AWS:

    1. Para proteger workloads usando o EC2 ou ECS, implante um Elastic Load Balancer na frente dos recursos computacionais. Em seguida, o Elastic Load Balancing fornece a solução para detectar as instâncias nas zonas com problemas de integridade e rotear o tráfego para as instâncias íntegras.

    2. No caso de instâncias do EC2 executando software comercial pronto para uso que não oferece suporte ao balanceamento de carga, você pode obter uma forma de tolerância a falhas implementando uma metodologia de recuperação de desastres Multi-AZ.

    3. Para tarefas do Amazon ECS, implante seu serviço uniformemente em três AZs para alcançar um equilíbrio entre disponibilidade e custo.

    4. Para o Amazon RDS não Aurora, você pode escolher Multi-AZ como opção de configuração. Em caso de falha na instância primária do banco de dados, o Amazon RDS promove automaticamente um banco de dados em espera para receber tráfego em outra zona de disponibilidade. Réplicas de leitura em várias regiões também podem ser criadas para melhorar a resiliência.

  3. Veja a seguir alguns exemplos de funcionalidades multirregiões fornecidas pelos serviços da AWS:

    1. Para workloads do Amazon S3 em que a disponibilidade Multi-AZ é fornecida automaticamente pelo serviço, considere pontos de acesso multirregiões se uma implantação multirregiões for necessária.

    2. Para tabelas do DynamoDB em que a disponibilidade Multi-AZ é fornecida automaticamente pelo serviço, você pode converter facilmente as tabelas existentes em tabelas globais para aproveitar as vantagens de várias regiões.

    3. Se sua workload for comandada por Application Load Balancers ou Network Load Balancers, use o AWS Global Accelerator para melhorar a disponibilidade da aplicação direcionando o tráfego para várias regiões que contêm endpoints íntegros.

    4. Para aplicações que utilizam o AWS EventBridge, considere os barramentos entre regiões para encaminhar eventos para outras regiões que você selecionar.

    5. Para bancos de dados do Amazon Aurora, considere os bancos de dados globais do Aurora, pois eles abrangem várias regiões da AWS. Os clusters existentes também podem ser modificados para adicionar novas regiões.

    6. Se sua workload incluir chaves de criptografia do AWS Key Management Service (AWS KMS), considere se as chaves multirregiões são apropriadas para a aplicação.

    7. Para outros recursos de serviço da AWS, consulte esta série de blogs sobre Criar aplicações multirregiões com serviços da AWS

Nível de esforço do plano de implementação: Moderado a alto

Recursos

Documentos relacionados:

Vídeos relacionados:

Exemplos relacionados: