Información general de la tolerancia a errores de clúster de Amazon DocumentDB - Amazon DocumentDB

Información general de la tolerancia a errores de clúster de Amazon DocumentDB

Los clústeres de Amazon DocumentDB ofrecen tolerancia a errores por diseño. Cada volumen de clúster abarca varias zonas de disponibilidad en una sola Región de AWS, de modo que cada zona de disponibilidad contiene una copia de los datos del volumen del clúster. Esta funcionalidad significa que el clúster puede tolerar un error de una zona de disponibilidad sin perder datos y con tan solo una interrupción breve del servicio.

Si se produce un error en la instancia principal de un clúster de base de datos, Amazon DocumentDB conmuta automáticamente a una nueva instancia principal de una de las dos formas siguientes:

  • Promocionando una réplica de Amazon DocumentDB existente a la nueva instancia principal elegida en función de la configuración del nivel de promoción de cada réplica y, a continuación, creando una que sustituya a la anterior principal. Una conmutación por error a la instancia de réplica suele tardar menos de 30 segundos. Las operaciones de lectura y escritura pueden sufrir breves interrupciones durante este período. Para aumentar la disponibilidad de su clúster de base de datos, es recomendable que cree al menos una o varias réplicas de Amazon DocumentDB en dos o más zonas de disponibilidad diferentes.

  • Creando una nueva instancia principal. Esto solo ocurre si no tiene una instancia de réplica en el clúster y puede tardar unos minutos en completarse.

Si el clúster tiene una o varias réplicas de Amazon DocumentDB, se promueve una réplica de Amazon DocumentDB a instancia principal durante un evento de error. Un evento de error provoca una interrupción breve durante la cual las operaciones de lectura y escritura generan errores con una excepción. Sin embargo, el servicio se suele restaurar en menos de 120 segundos y, en muchos casos, en menos de 60 segundos. Para aumentar la disponibilidad de su clúster de base de datos, es recomendable que cree al menos una o varias réplicas de Amazon DocumentDB en dos o más zonas de disponibilidad diferentes.

Puede personalizar el orden en que se promueven las réplicas de Amazon DocumentDB a instancia principal tras un error mediante la asignación de una prioridad a cada réplica. Las prioridades van desde 0 para la prioridad más alta hasta 15 para la más baja. Si la instancia principal experimenta un error, la réplica de Amazon DocumentDB que tenga la máxima prioridad pasará a ser la instancia principal. Puede modificar la prioridad de una réplica de Amazon DocumentDB en cualquier momento. Al modificar la prioridad, no se activa una conmutación por error. Puede usar la operación modify-db-instance con el parámetro --promotion-tier. Para obtener más información acerca de cómo personalizar la prioridad de conmutación por error de una instancia, consulte Conmutación por error a Amazon DocumentDB.

Puede haber más de una réplica de Amazon DocumentDB con la misma prioridad, lo que genera niveles de promoción. Si dos o más réplicas de Amazon DocumentDB comparten la misma prioridad, pasará a ser la instancia principal la réplica que tiene un tamaño mayor. Si dos o más réplicas de Amazon DocumentDB tienen la misma prioridad y el mismo tamaño, se promueve una réplica arbitraria del mismo nivel de promoción.

Si el clúster no contiene ninguna réplica de Amazon DocumentDB, la instancia principal se vuelve a crear durante un evento de error. Un evento de error provoca una interrupción durante la cual las operaciones de lectura y escritura generan errores con una excepción. El servicio se restaura cuando se crea la nueva instancia principal, un proceso que normalmente dura menos de 10 minutos. Promover una réplica de Amazon DocumentDB a instancia principal es mucho más rápido que crear una nueva instancia principal.