Configuración de un dominio Multi-AZ en Amazon Service OpenSearch - OpenSearch Servicio Amazon

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración de un dominio Multi-AZ en Amazon Service OpenSearch

Para evitar la pérdida de datos y minimizar el tiempo de inactividad del clúster de Amazon OpenSearch Service en caso de una interrupción del servicio, puede distribuir los nodos en dos o tres zonas de disponibilidad de la misma región, una configuración conocida como Multi-AZ. Las zonas de disponibilidad son ubicaciones aisladas dentro de cada AWS región.

Para los dominios que ejecutan cargas de trabajo de producción, recomendamos la opción de implementación de Multi-AZ con modo de espera, que crea la siguiente configuración:

  • El dominio implementado en tres zonas.

  • Tipo de instancia de la generación actual para los nodos maestros dedicados y los nodos de datos.

  • Tres nodos maestros dedicados y tres (o un múltiplo de tres) nodos de datos.

  • Al menos dos réplicas para cada índice de su dominio o un múltiplo de tres copias de datos (incluidos los nodos principales y las réplicas).

El resto de esta sección contiene explicaciones y contextos sobre estas configuraciones.

Multi-AZ con modo de espera

Multi-AZ with Standby es una opción de implementación para los dominios de Amazon OpenSearch Service que ofrece una disponibilidad del 99,99%, un rendimiento uniforme para las cargas de trabajo de producción y una configuración y administración de dominios simplificadas. Cuando utilice Multi-AZ con modo de espera, los dominios son resistentes a los fallos de infraestructura, sin que ello afecte al rendimiento ni a la disponibilidad. Esta opción de implementación cumple con este estándar al exigir una serie de prácticas recomendadas, como un recuento específico de nodos de datos, un recuento de nodos maestros, un tipo de instancia, un recuento de réplicas, la configuración de las actualizaciones de software y la activación del ajuste automático.

Al utilizar Multi-AZ con modo de espera, OpenSearch Service crea un dominio en tres zonas de disponibilidad, cada una de las cuales contiene una copia completa de los datos y los datos se distribuyen equitativamente en cada una de las zonas. Su dominio reserva los nodos de una de estas zonas como en espera, lo que significa que no atienden solicitudes de búsqueda. Cuando el OpenSearch servicio detecta un fallo en la infraestructura subyacente, activa automáticamente los nodos en espera en menos de un minuto. El dominio sigue atendiendo las solicitudes de indexación y búsqueda, y cualquier impacto se limita al tiempo que se tarda en realizar la conmutación por error. No hay redistribución de los datos o los recursos, por lo que el rendimiento del clúster no se ve afectado y no hay riesgo de que se degrade la disponibilidad. Multi-AZ con modo de espera está disponible sin costo adicional.

Tiene dos opciones para crear un dominio con el modo de espera en AWS Management Console. En primer lugar, puede crear un dominio con el método de creación fácil y OpenSearch Service utilizará automáticamente una configuración predeterminada, que incluye lo siguiente:

  • Tres zonas de disponibilidad, una de las cuales actúa como zona de espera

  • Tres nodos maestros y de datos dedicados

  • El ajuste automático está habilitado en el dominio

  • Almacenamiento GP3 para los nodos de datos

También puede elegir el método de Creación estándar y seleccionar Dominio con modo de espera como opción de implementación. Esto le permite personalizar su dominio sin dejar de utilizar las características clave del modo de espera, como tres zonas y tres nodos maestros. Recomendamos elegir un recuento de nodos de datos que sea múltiplo de tres (el número de zonas de disponibilidad).

Una vez que haya creado su dominio, puede ir a las páginas de detalles del dominio y, en la pestaña Configuración del clúster, confirmar que en las zonas de disponibilidad aparezca 3-AZ con modo de espera.

Si tiene problemas para migrar un dominio existente a Multi-AZ con modo de espera, consulte Error migrating to Multi-AZ with Standby en la guía de solución de problemas.

Limitaciones

Al configurar un dominio con Multi-AZ con modo de espera, tenga en cuenta las siguientes limitaciones:

  • El número total de particiones de un nodo no puede superar los 1000, el número total de particiones de un clúster no puede superar los 75 000 y el tamaño de una sola partición no puede superar los 65 GB.

  • Multi-AZ con modo de espera solo funciona con los tipos de instancia m5, c5, r5, r6g, c6g, m6g, r6gd y i3. Para obtener más información sobre los tipos de instancias admitidos, consulte Tipos de instancias admitidos.

  • Solo puede utilizar un SSD de IOPS aprovisionado, un SSD de uso general (GP3) o un almacenamiento respaldado por instancias con modo de espera.

  • Si lo habilita UltraWarmen un dominio Multi-AZ con modo de espera, el número de nodos en espera debe ser un múltiplo del número de zonas de disponibilidad que se estén utilizando.

Multi-AZ sin modo de espera

OpenSearch El servicio sigue siendo compatible con Multi-AZ sin modo de espera, lo que ofrece una disponibilidad del 99,9%. Los nodos se distribuyen en las zonas de disponibilidad y la disponibilidad depende del número de zonas de disponibilidad y de las copias de los datos. Mientras que en el modo de espera hay que configurar el dominio según las prácticas recomendadas, sin el modo de espera puede elegir su propio número de zonas de disponibilidad, nodos y réplicas. No recomendamos esta opción a menos que tenga flujos de trabajo existentes que se verían interrumpidos al crear dominios con el modo de espera.

Si elige esta opción, le recomendamos que seleccione tres zonas de disponibilidad para seguir siendo resistente a los errores de nodos, discos y zonas de disponibilidad única. Cuando se produce un error, el clúster redistribuye los datos entre los recursos restantes para mantener la disponibilidad y la redundancia. Este movimiento de datos aumenta el uso de recursos en el clúster y puede afectar al rendimiento. Si el clúster no tiene el tamaño adecuado, puede experimentar una disminución de la disponibilidad, lo que en gran medida va en contra del propósito de las zonas de disponibilidad múltiples.

La única forma de configurar un dominio sin modo de espera AWS Management Console es elegir el método de creación estándar y seleccionar Dominio sin modo de espera como opción de despliegue.

Distribución de particiones

Si habilita Multi-AZ sin modo de espera, debe haber al menos una réplica por cada índice del clúster. Sin réplicas, OpenSearch Service no puede distribuir copias de sus datos a otras zonas de disponibilidad. Afortunadamente, la configuración predeterminada para cualquier índice es un recuento de réplicas de 1. Como se muestra en el siguiente diagrama, OpenSearch Service hace todo lo posible por distribuir los fragmentos principales y sus correspondientes fragmentos de réplica en distintas zonas.

Además de distribuir los fragmentos por zona de disponibilidad, OpenSearch Service los distribuye por nodo. Sin embargo, ciertas configuraciones de dominio pueden generar un número desequilibrado de particiones. Imagine el siguiente dominio:

  • 5 nodos de datos

  • 5 particiones principales

  • 2 réplicas

  • 3 zonas de disponibilidad

En esta situación, el OpenSearch servicio tiene que sobrecargar un nodo para poder distribuir los fragmentos principales y de réplica entre las zonas, como se muestra en el siguiente diagrama.

Para evitar este tipo de situaciones, que pueden ejercer demasiada presión sobre determinados nodos y perjudicar el rendimiento, le recomendamos que elija multi-AZ con modo de espera o que elija un número de instancias que sea múltiplo de tres cuando planee tener dos o más réplicas por cada índice.

Distribución de nodos maestros dedicados

Incluso si selecciona dos zonas de disponibilidad al configurar su dominio, OpenSearch Service distribuye automáticamente los nodos principales dedicados en tres zonas de disponibilidad. Esta distribución ayuda a evitar el tiempo de inactividad del clúster si una zona experimenta una interrupción del servicio. Si está utilizando los tres nodos principales dedicados recomendados y una zona de disponibilidad deja de funcionar, el clúster seguirá teniendo un quorum (2) de nodos principales dedicados y podrá seleccionar un nuevo nodo principal. En el siguiente diagrama, se muestra esta configuración.

Si selecciona un tipo de instancia de una generación anterior que no esté disponible en tres zonas de disponibilidad, pueden producirse las siguientes situaciones:

  • Si ha elegido tres zonas de disponibilidad para el dominio, el OpenSearch servicio generará un error. Seleccione un tipo de instancia distinto y vuelva a intentarlo.

  • Si elige dos zonas de disponibilidad para el dominio, OpenSearch Service distribuye los nodos principales dedicados en dos zonas.

Interrupción de las zonas de disponibilidad

No es frecuente que el servicio se interrumpa en las zonas de disponibilidad, pero puede ocurrir. En la siguiente tabla, se muestran diferentes configuraciones de Multi-AZ y los comportamientos durante una interrupción. La última fila de la tabla se aplica a Multi-AZ con modo de espera, mientras que todas las demás filas tienen configuraciones que solo se aplican a Multi-AZ sin modo de espera.

Número de zonas de disponibilidad de una región Número de zonas de disponibilidad seleccionado Número de nodos maestros dedicados Comportamiento si se interrumpe una zona de disponibilidad
2 o más 2 0

Tiempo de inactividad. El clúster pierde la mitad de los nodos de datos y debe sustituir al menos uno en la zona de disponibilidad que queda antes de poder elegir un nodo principal.

2 2 3

Posibilidad de que se produzca un tiempo de inactividad del 50/50. OpenSearch El servicio distribuye dos nodos maestros dedicados en una zona de disponibilidad y uno en la otra:

  • Si la zona de disponibilidad con un nodo principal dedicado se interrumpe, los dos nodos principales dedicados de la otra zona de disponibilidad pueden elegir un nodo principal.

  • Si la zona de disponibilidad con dos nodos maestros dedicados experimenta una interrupción, el clúster no estará disponible hasta que la zona de disponibilidad restante se recupere.

3 o más 2 3

Sin tiempo de inactividad. OpenSearch El servicio distribuye automáticamente los nodos maestros dedicados en tres zonas de disponibilidad, de modo que los dos nodos maestros dedicados restantes pueden elegir un nodo maestro.

3 o más 3 0

No hay tiempo de inactividad. Aproximadamente dos tercios de los nodos de datos seguirán estando disponibles para elegir un nodo principal.

3 o más 3 3

No hay tiempo de inactividad. Los otros dos nodos principales dedicados pueden elegir un nodo principal.

En todas las configuraciones, independientemente de la causa, las fallas de los nodos pueden provocar que los nodos de datos restantes del clúster experimenten un período de mayor carga, mientras que OpenSearch Service configura automáticamente nuevos nodos para reemplazar los que ahora faltan.

Por ejemplo, en caso de que se interrumpa una zona de disponibilidad de una configuración de tres zonas, solo dos tercios de los nodos de datos tendrán que procesar tantas solicitudes como lleguen al clúster. A medida que se procesen estas solicitudes, los nodos restantes irán replicando particiones en los nuevos nodos tan pronto como se conecten, lo que podría afectar aún más al rendimiento. Si la disponibilidad es esencial para la carga de trabajo, considere la posibilidad de añadir más recursos al clúster para mitigar este problema.

nota

OpenSearch El servicio administra los dominios Multi-AZ de forma transparente, por lo que no es posible simular manualmente las interrupciones en las zonas de disponibilidad.