As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Práticas recomendadas ao configurar o deslocamento automático zonal
Esteja ciente das seguintes melhores práticas e considerações ao habilitar o deslocamento automático zonal no Amazon Application Recovery Controller (). ARC
O deslocamento automático zonal inclui dois tipos de turnos de tráfego: turnos automáticos e turnos zonais de execução prática.
Com um deslocamento automático, AWS ajuda a reduzir seu tempo de recuperação ao afastar o tráfego de recursos do aplicativo de uma zona de disponibilidade durante eventos, em seu nome.
Com os treinos, ARC inicia uma mudança zonal em seu nome. A mudança zonal transfere o tráfego de uma zona de disponibilidade para um recurso e vice-versa, em um ritmo semanal. As execuções práticas ajudam você a garantir que tenha aumentado a escala vertical de capacidade suficiente das zonas de disponibilidade em uma região para que a aplicação tolere a perda de uma zona de disponibilidade.
Há várias práticas recomendadas e considerações a serem lembradas com mudanças automáticas e ensaios práticos. Analise os tópicos a seguir antes de habilitar a mudança automática de zona ou configurar execuções práticas para um recurso.
Tópicos
- Limite o tempo em que os clientes permanecem conectados aos seus endpoints
-
Quando o Amazon Application Recovery Controller (ARC) afasta o tráfego de uma deficiência, por exemplo, usando a mudança zonal ou a mudança automática zonal, o mecanismo ARC usado para mover o tráfego do seu aplicativo é uma atualização. DNS Uma DNS atualização faz com que todas as novas conexões sejam direcionadas para fora do local danificado. No entanto, clientes com conexões abertas preexistentes podem continuar fazendo solicitações no local danificado até que os clientes se reconectem. Para garantir uma recuperação rápida, recomendamos que você limite a quantidade de tempo que os clientes permanecem conectados aos seus endpoints.
Se você usar um Application Load Balancer, poderá usar a
keepalive
opção para configurar por quanto tempo as conexões continuarão. Sugerimos que você reduza okeepalive
valor para estar alinhado com a meta de tempo de recuperação do aplicativo, por exemplo, 300 segundos. Ao escolher umkeepalive
horário, considere que esse valor é uma troca entre se reconectar com mais frequência em geral, o que pode afetar a latência, e afastar mais rapidamente todos os clientes de uma AZ ou região com problemas.Para obter mais informações sobre como definir a
keepalive
opção para o Application Load Balancer, consulte a duração da manutenção de atividade do HTTP cliente no Guia do usuário do Application Load Balancer. - Pré-escale sua capacidade de recursos e teste a mudança de tráfego
-
Ao AWS transferir o tráfego de uma zona de disponibilidade para uma mudança zonal ou automática, é importante que as demais zonas de disponibilidade possam atender ao aumento das taxas de solicitação do seu recurso. Esse padrão é conhecido como estabilidade estática. Para obter mais informações, consulte o whitepaper Estabilidade estática usando zonas de disponibilidade
na Amazon Builders' Library. Por exemplo, se uma aplicação precisar de 30 instâncias para atender os clientes, você deverá provisionar 15 instâncias em três zonas de disponibilidade, totalizando 45 instâncias. Ao fazer isso, quando o tráfego AWS sai de uma zona de disponibilidade — com um deslocamento automático ou durante uma execução prática — ainda AWS pode atender aos clientes do seu aplicativo com o total restante de 30 instâncias, em duas zonas de disponibilidade.
O recurso de mudança automática zonal ARC ajuda você a se recuperar rapidamente de AWS eventos em uma zona de disponibilidade quando você tem um aplicativo com recursos pré-escalados para funcionar normalmente com a perda de uma zona de disponibilidade. Antes de habilitar a mudança automática de zona para um recurso, ajuste a escala de capacidade do recurso em todas as zonas de disponibilidade configuradas em uma Região da AWS. Depois, inicie as mudanças de zona para o recurso a fim de testar se a aplicação ainda funciona normalmente quando o tráfego é transferido para fora de uma zona de disponibilidade.
Depois de realizar testes com mudanças de zona, habilite a mudança automática de zona e configure execuções práticas para os recursos da aplicação. As execuções práticas regulares com mudança automática de zona ajudam você a garantir, continuamente, que a capacidade ainda seja dimensionada adequadamente. Com capacidade suficiente em todas as zonas de disponibilidade, a aplicação pode continuar atendendo os clientes, sem interrupção, durante uma mudança automática.
Para obter mais informações sobre como iniciar uma mudança de zona para um recurso, consulte Mudança zonal em ARC.
- Esteja ciente dos tipos e restrições de recursos
A mudança automática de zona oferece suporte à transferência do tráfego para fora de uma zona de disponibilidade para todos os recursos que são compatíveis com a mudança de zona. Em geral, há suporte para Network Load Balancers e Application Load Balancers com balanceamento de carga entre zonas desativado. Em alguns cenários de recursos específicos, a mudança automática de zona não transfere o tráfego para fora de uma zona de disponibilidade para uma mudança automática.
Por exemplo, se os grupos de destino do balanceador de carga nas zonas de disponibilidade não tiverem nenhuma instância ou se nenhuma das instâncias estiverem íntegras, o balanceador de carga estará em um estado de falha aberta. Se AWS iniciar um deslocamento automático para um balanceador de carga nesse cenário, um deslocamento automático não alterará quais zonas de disponibilidade o balanceador de carga usa porque o balanceador de carga já está em um estado de falha aberta. Esse comportamento é esperado. O deslocamento automático não pode causar problemas de integridade em uma zona de disponibilidade e transferir o tráfego para outras zonas de disponibilidade em Região da AWS caso de falha na abertura de todas as zonas de disponibilidade (não íntegras).
Um segundo cenário é se AWS iniciar um deslocamento automático para um Application Load Balancer que é um endpoint para um acelerador em. AWS Global Accelerator Assim como no caso da mudança de zona, a mudança automática não é compatível com Application Load Balancers que são endpoints de aceleradores no Global Accelerator.
Para conferir detalhes sobre os recursos compatíveis, incluindo todos os requisitos e exceções que você deve conhecer, consulte Recursos compatíveis.
- Especifique alarmes para treinos
-
Você configura pelo menos um alarme (o alarme de resultado) para exercícios com mudança automática zonal. Opcionalmente, você também pode configurar um segundo alarme (o alarme de bloqueio).
Ao considerar os CloudWatch alarmes que você configura para execuções práticas do seu recurso, lembre-se do seguinte:
Para o alarme de resultado, que é obrigatório, recomendamos que você configure um CloudWatch alarme para entrar em um
ALARM
estado em que as métricas do recurso ou do seu aplicativo indiquem que o deslocamento do tráfego para fora da Zona de Disponibilidade afeta negativamente o desempenho. Por exemplo, você pode determinar um limite para as taxas de solicitação do recurso, depois configurar um alarme para entrar em um estadoALARM
quando o limite for excedido. Você é responsável por configurar um alarme apropriado que faça com que a AWS encerre a execução prática e retorne um resultadoFAILED
.Recomendamos que você siga o AWS Well Architected Framework, que recomenda a implementação de indicadores-chave de desempenho (KPIs) como CloudWatch alarmes. Se você fizer isso, poderá usar esses alarmes para criar um alarme composto para usar como gatilho de segurança, para evitar que os treinos sejam iniciados, caso possam fazer com que seu aplicativo perca um. KPI Quando o alarme não está mais em um
ALARM
estado, ARC inicia a execução da prática na próxima vez que uma execução prática for agendada para o recurso.Para o alarme de bloqueio de execução prática, caso opte por configurá-lo, você poderá escolher rastrear uma métrica específica usada para indicar que não deseja que uma execução prática seja iniciada.
Para realizar alarmes de execução prática, você especifica o Amazon Resource Name (ARN) para cada alarme, que você deve primeiro configurar na Amazon CloudWatch. Os CloudWatch alarmes que você especifica podem ser alarmes compostos, para permitir que você inclua várias métricas e verificações para seu aplicativo e recurso que podem fazer com que o alarme entre em um estado.
ALARM
Para obter mais informações, consulte Combinação de alarmes no Guia do CloudWatch usuário da Amazon.Certifique-se de que os CloudWatch alarmes que você especifica para os treinos estejam na mesma região do recurso para o qual você está configurando um treino.
- Avalie os resultados dos treinos
ARCrelata um resultado para cada treino. Depois de um treino, avalie o resultado e determine se você precisa agir. Por exemplo, talvez seja necessário escalar a capacidade ou ajustar a configuração de um alarme.
Veja a seguir os possíveis resultados para uma execução prática:
SUCCEEDED: O alarme de resultado não entrou em um
ALARM
estado durante a execução prática e a execução prática completou todo o período de teste de 30 minutos.FAILED: O alarme de resultado entrou em um
ALARM
estado durante a execução do treino.INTERRUPTED: A execução prática foi encerrada por um motivo que não foi o alarme de resultado entrando em um
ALARM
estado. Uma execução prática pode ser interrompida por vários motivos, inclusive pelos seguintes:O treino foi encerrado porque AWS iniciou um câmbio automático na Região da AWS ou houve uma condição de alarme na região.
A execução prática foi encerrada porque a configuração da execução prática foi excluída do recurso.
A execução prática foi encerrada porque o cliente iniciou uma mudança de zona para o recurso na zona de disponibilidade da qual a mudança de zona para execução prática estava transferindo o tráfego.
A execução prática foi encerrada porque um CloudWatch alarme especificado para a configuração da execução prática não pode mais ser acessado.
A execução prática foi encerrada porque o alarme de bloqueio especificado para a execução prática entrou em um estado
ALARM
.A execução prática foi encerrada por um motivo desconhecido.
PENDING: A corrida prática está ativa (em andamento). Ainda não há resultado a ser retornado.