Configuração de um domínio Multi-AZ no Amazon OpenSearch Service - OpenSearch Serviço Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configuração de um domínio Multi-AZ no Amazon OpenSearch Service

Para evitar perda de dados e minimizar o tempo de inatividade do cluster do Amazon OpenSearch Service no caso de uma interrupção do serviço, você pode distribuir os nós em duas ou três zonas de disponibilidade na mesma região, uma configuração conhecida como Multi-AZ. As zonas de disponibilidade são vários locais isolados dentro de cada região da AWS.

Para domínios que executam workloads de produção, recomendamos a opção de implantação multi-AZ com modo de espera, que cria a seguinte configuração:

  • Domínio implementado em três zonas.

  • Tipos de instância da geração atual para os nós principais dedicados e nós de dados.

  • Três nós principais dedicados e três (ou um múltiplo de três) nós de dados.

  • Pelo menos duas réplicas para cada índice no seu domínio ou um múltiplo de três cópias de dados (incluindo nós primários e réplicas).

O restante desta seção fornece explicações e contexto para estas configurações.

Multi-AZ com modo de espera

O multi-AZ com modo de espera é uma opção de implantação para domínios do Amazon OpenSearch Service que oferece disponibilidade de 99,99%, desempenho consistente para cargas de trabalho de produção e configuração e gerenciamento simplificados de domínios. Quando você usa o multi-AZ com modo de espera, os domínios são resilientes a falhas de infraestrutura, sem impacto no desempenho ou na disponibilidade. Essa opção de implantação atinge esse padrão ao exigir várias práticas recomendadas, como uma contagem especificada de nós de dados, contagem de nós principais, tipo de instância, contagem de réplicas, configurações de atualização de software e ajuste automático ativado.

Quando você usa o multi-AZ com modo de espera, o OpenSearch Service cria um domínio em três zonas de disponibilidade, com cada zona contendo uma cópia completa dos dados e com os dados distribuídos igualmente em cada uma das zonas. Seu domínio reserva nós em uma dessas zonas como modo de espera, o que significa que eles não atendem a solicitações de pesquisa. Quando o OpenSearch Service detecta uma falha na infraestrutura subjacente, ele ativa automaticamente os nós em espera em menos de um minuto. O domínio continua atendendo às solicitações de indexação e pesquisa, e qualquer impacto é limitado ao tempo necessário para realizar o failover. Não há redistribuição de dados ou recursos, o que resulta em desempenho inalterado do cluster e sem risco de redução da disponibilidade. O multi-AZ com modo de espera está disponível sem custo adicional.

Você tem duas opções para criar um domínio com modo de espera no AWS Management Console. Primeiro, você pode criar um domínio com o método de criação Criação rápida , e o OpenSearch Service usará automaticamente uma configuração predeterminada, que inclui o seguinte:

  • Três zonas de disponibilidade, com uma atuando como reserva

  • Três nós principais e nós de dados dedicados

  • Ajuste automático ativado no domínio

  • Armazenamento GP3 para os nós de dados

Você também pode escolher o método Criação padrão e selecionar Domínio com modo de espera como sua opção de implantação. Isso permite que você personalize seu domínio e, ao mesmo tempo, exija os principais atributos do modo de espera, como três zonas e três nós principais. Recomendamos escolher uma contagem de nós de dados que seja múltipla de três (o número de zonas de disponibilidade).

Depois de criar seu domínio, você pode navegar até as páginas de detalhes do domínio e, na guia Configuração do cluster, confirmar se 3-AZ com espera aparece em Zona(s) de Disponibilidade.

Se você tiver problemas ao migrar um domínio existente para o multi-AZ com modo de espera, consulte Erro ao migrar para o multi-AZ com modo de espera no guia de solução de problemas.

Limitações

Ao configurar um domínio com multi-AZ com modo de espera, considere as seguintes limitações:

  • O número total de fragmentos em um nó não pode exceder 1.000, o número total de fragmentos em um cluster não pode exceder 75.000 e o tamanho de um único fragmento não pode exceder 65 GB.

  • O multi-AZ com modo de espera funciona somente com os tipos de instância m5, c5, r5, r6g, c6g, m6g, r6gd e i3. Para obter mais informações sobre instâncias compatíveis, consulte Tipos de instância compatíveis.

  • Você só pode usar SSD de IOPs provisionadas, SSD de uso geral (GP3) ou armazenamento baseado em instância com modo de espera.

  • Se você habilitar o UltraWarm em um domínio Multi-AZ com modo de espera, o número de nós de alta atividade deverá ser um múltiplo do número de zonas de disponibilidade que estão sendo usadas.

Multi-AZ sem modo de espera

O OpenSearch Service ainda oferece suporte ao Multi-AZ sem modo de espera, o que oferece 99,9% de disponibilidade. Os nós são distribuídos em zonas de disponibilidade, e a disponibilidade depende do número de zonas de disponibilidade e cópias dos dados. Enquanto no modo de espera você precisa configurar seu domínio com as melhores práticas, sem o modo de espera você pode escolher seu próprio número de zonas de disponibilidade, nós e réplicas. Não recomendamos essa opção, a menos que você tenha fluxos de trabalho existentes que seriam interrompidos pela criação de domínios em espera.

Se você escolher essa opção, ainda recomendamos que você selecione três zonas de disponibilidade para permanecer resiliente a falhas de nó, disco e single-AZ. Quando ocorre uma falha, o cluster redistribui os dados pelos recursos restantes para manter a disponibilidade e a redundância. Essa movimentação de dados aumenta o uso de recursos no cluster e pode ter um impacto no desempenho. Se o cluster não for dimensionado adequadamente, ele poderá ter uma disponibilidade reduzida, o que, em grande parte, anula o propósito do multi-AZ.

A única maneira de configurar um domínio sem modo de espera no AWS Management Console é escolher o método Criação padrão e selecionar Domínio sem modo de espera como sua opção de implantação.

Distribuição de fragmentos

Se habilitar Multi-AZ sem standby, você deverá ter pelo menos uma réplica para cada índice no cluster. Sem réplicas, o OpenSearch Service não pode distribuir cópias de seus dados para outras Zonas de disponibilidade. Felizmente, a configuração padrão para qualquer índice é uma contagem de réplica de 1. Como mostrado no diagrama a seguir, o OpenSearch Service faz um melhor esforço para distribuir fragmentos primários e seus fragmentos de réplica correspondentes para diferentes zonas.

Diagram showing three Availability Zones, each with primary and replica shards distributed across them.

Além de distribuir os fragmentos por zona de disponibilidade, o OpenSearch Service os distribui por nós. Ainda assim, determinadas configurações de domínio podem resultar em contagens de fragmentos desequilibradas. Considere o seguinte domínio:

  • 5 nós de dados

  • 5 fragmentos principais

  • 2 réplicas

  • 3 zonas de disponibilidade

Nessa situação, o OpenSearch Service tem que sobrecarregar um nó para distribuir os fragmentos principais e de réplica entre as zonas, como mostrado no diagrama a seguir.

Diagram showing distribution of primary and replica shards across three availability zones.

Para evitar esses tipos de situações, que podem sobrecarregar nós individuais e afetar a performance, recomendamos selecionar multi-AZ com modo de espera ou uma contagem de instâncias que seja um múltiplo de três quando você planejar ter duas ou mais réplicas por índice.

Distribuição de nó principal dedicado

Mesmo se você selecionar duas zonas de disponibilidade ao configurar seu domínio, o OpenSearch Service distribuirá automaticamente os nós principais dedicados em três zonas de disponibilidade. Essa distribuição ajuda a evitar tempo de inatividade do cluster se uma zona sofrer uma interrupção de serviço. Se você usar os três nós principais dedicados recomendados e uma zona de disponibilidade ficar inativa, seu cluster ainda terá um quórum (2) de nós principais dedicados e poderá selecionar um novo principal. O diagrama a seguir demonstra essa configuração.

Diagram showing distribution of primary and replica nodes across three Availability Zones.

Se você escolher um tipo de instância de gerações anteriores que não esteja disponível nas três zonas de disponibilidade, os seguintes cenários se aplicam:

  • Se você escolher três zonas de disponibilidade para o domínio, o OpenSearch Service lançará um erro. Escolha um tipo de instância diferente e tente novamente.

  • Se você escolher duas zonas de disponibilidade para o domínio, o OpenSearch Service distribuirá os nós principais dedicados em duas zonas.

Interrupções na zona de disponibilidade

As interrupções na zona de disponibilidade são raras, mas ocorrem. A tabela a seguir relaciona diferentes configurações de Multi-AZ e comportamentos durante uma interrupção. A última linha na tabela se aplica ao multi-AZ com modo de espera, enquanto todas as outras linhas têm configurações que se aplicam somente ao multi-AZ sem modo de espera.

Número de zonas de disponibilidade em uma região Número de zonas de disponibilidade que você escolheu Número de nós principais dedicados Comportamento se uma zona de disponibilidade apresentar uma interrupção
2 ou mais 2 0

Tempo de inatividade. Seu cluster perde metade dos seus nós de dados e deve substituir pelo menos um na zona de disponibilidade restante antes que possa escolher um principal.

2 2 3

50% de chance de tempo de inatividade. O OpenSearch Service distribui dois nós principais dedicados em uma zona de disponibilidade e um na outra:

  • Se a zona de disponibilidade com um nó principal dedicado tiver uma interrupção, os dois nós principais dedicados na zona de disponibilidade restante podem escolher um principal.

  • Se a zona de disponibilidade com dois nós principais dedicados apresentar uma interrupção, o cluster permanecerá indisponível até que a zona de disponibilidade se recupere.

3 ou mais 2 3

Sem tempo de inatividade. O OpenSearch Service distribui automaticamente os nós principais dedicados em três zonas de disponibilidade para que os dois nós principais dedicados restantes possam escolher um principal.

3 ou mais 3 0

Sem tempo de inatividade. Aproximadamente, dois terços dos seus nós de dados ainda estão disponíveis para escolher um principal.

3 ou mais 3 3

Sem tempo de inatividade. Os dois nós principais dedicados restantes podem escolher um principal.

Em todas as configurações, independentemente da causa, as falhas de nó podem fazer com que os nós de dados restantes do cluster passem por um período de aumento de carga enquanto o OpenSearch Service configura automaticamente novos nós para substituir os agora ausentes.

Por exemplo, no caso de uma falha na zona de disponibilidade em uma configuração de três zonas, dois terços dos nós de dados terão que processar várias solicitações para o cluster. Conforme eles processam essas solicitações, os nós restantes também estão replicando fragmentos para novos nós à medida que ficam online, o que pode afetar ainda mais a performance. Se a disponibilidade for essencial para sua workload, considere a adição de recursos ao seu cluster para diminuir essa preocupação.

nota

O OpenSearch Service gerencia domínios Multi-AZ de forma transparente para que não seja possível simular manualmente interrupções da zona de disponibilidade.