La instancia de base de datos principal Read-replica instancias Dimensionamiento de instancias Monitorización de instancias

Clústeres e instancias de base de datos de Amazon Neptune

Un clúster de base de datos de Amazon Neptune administra el acceso a sus datos mediante consultas. Un clúster se compone de:

Una instancia de base de datos principal .
Hasta 15 instancias de base de datos de réplica de lectura.

Todas las instancias de un clúster comparten el mismo volumen de almacenamiento administrado subyacente, que está diseñado para ofrecer fiabilidad y alta disponibilidad.

Para conectarse a las instancias de base de datos de su clúster de base de datos, debe utilizar los puntos de conexión de Neptune.

La instancia de base de datos principal de un clúster de base de datos de Neptune

La instancia de base de datos principal coordina todas las operaciones de escritura en el volumen de almacenamiento subyacente del clúster de base de datos. También admite operaciones de lectura.

Solo puede haber una instancia de base de datos principal en un clúster de base de datos de Neptune. Si la instancia principal deja de estar disponible, Neptune conmuta automáticamente por error a una de las instancias de réplica de lectura con una prioridad que puede especificar.

Read-replica Instancias de base de datos en un clúster de base de datos de Neptune

Después de crear la instancia principal de un clúster de base de datos, puede crear un máximo de 15 réplicas de lectura en el clúster de base de datos para permitir las consultas de solo lectura.

Las instancias de base de datos de réplica de lectura de Neptune funcionan bien para escalar la capacidad de lectura porque están totalmente dedicadas a operaciones de lectura en el volumen de su clúster. Todas las operaciones de escritura se administran en la instancia principal. Cada instancia de base de datos de réplica de lectura tiene su propio punto de conexión.

Como el volumen de almacenamiento del clúster se comparte entre todas las instancias de un clúster, todas las instancias de réplica de lectura devuelven los mismos datos para los resultados de las consultas con un retardo de replicación muy reducido. Este retardo suele ser muy inferior a 100 milisegundos después de que la instancia principal escriba una actualización, aunque puede ser algo mayor cuando el volumen de operaciones de escritura es muy grande.

Tener una o más instancias de réplica de lectura disponibles en distintas zonas de disponibilidad puede aumentar la disponibilidad, ya que las réplicas de lectura sirven como destinos de conmutación por error para la instancia principal. Es decir, si la instancia principal falla, Neptune promueve una instancia de réplica de lectura para convertirla en la instancia primaria. Cuando esto ocurre, se produce una breve interrupción mientras se reinicia la instancia promovida, durante la cual las solicitudes de lectura y escritura que se realizan a la instancia principal fallan con una excepción.

Por el contrario, si el clúster de base de datos no incluye ninguna instancia de lectura y réplica, el clúster de base de datos permanece no disponible cuando se produce un error en la instancia principal hasta que se vuelva a crear. Re-creating la instancia principal lleva mucho más tiempo que la promoción de una réplica de lectura.

Para garantizar una alta disponibilidad, le recomendamos que cree una o más instancias de réplica de lectura que tengan la misma clase de instancia de base de datos que la instancia principal y que estén ubicadas en zonas de disponibilidad diferentes a las de la instancia principal. Consulte Tolerancia a errores para un clúster de base de datos de Neptune.

Con la consola, puede crear un Multi-AZ despliegue simplemente Multi-AZ especificándolo al crear un clúster de base de datos. Si un clúster de base de datos se encuentra en una única zona de disponibilidad, puede convertirlo en un Multi-AZ clúster de base de datos añadiendo una réplica de Neptune en una zona de disponibilidad diferente.

nota

No puede crear una instancia de réplica de lectura cifrada para un clúster de base de datos de Neptune sin cifrar ni una instancia de réplica de lectura sin cifrar para un clúster de base de datos de Neptune cifrado.

Para obtener más información sobre cómo crear una instancia de base de datos de réplica de lectura de Neptune, consulte Creación de una instancia de lector de Neptune con la consola.

Dimensionamiento de las instancias de base de datos en un clúster de base de datos de Neptune

Cambie el tamaño de las instancias del clúster de base de datos de Neptune en función de los requisitos de CPU y memoria. La cantidad de vCPU en una instancia determina la cantidad de subprocesos de consulta que gestionan las consultas entrantes. La cantidad de memoria de una instancia determina el tamaño de la memoria caché del búfer, que se utiliza para almacenar copias de las páginas de datos extraídas del volumen de almacenamiento subyacente.

Cada instancia de base de datos de Neptune tiene un número de subprocesos de consulta que equivale a 2 veces el número de vCPU en esa instancia. Un r5.4xlarge, por ejemplo, con 16 vCPU, tiene 32 subprocesos de consulta y, por lo tanto, puede procesar 32 consultas simultáneamente.

Las consultas adicionales que llegan mientras todos los subprocesos de consulta están ocupados se colocan en una cola del lado del servidor y se procesan en orden FIFO a medida que los subprocesos de consulta vuelven a estar disponibles. Esta cola del servidor puede contener aproximadamente 8000 solicitudes pendientes. Una vez que esté llena, Neptune responde a las solicitudes adicionales con un ThrottlingException. Puede supervisar el número de solicitudes pendientes con la MainRequestQueuePendingRequests CloudWatch métrica o utilizando el punto final de estado de la consulta de Gremlin con el parámetro. includeWaiting

El tiempo de ejecución de la consulta desde la perspectiva del cliente incluye el tiempo que se pasa en la cola, además del tiempo que se tarda en ejecutar realmente la consulta.

Lo ideal es que una carga de escritura simultánea sostenida que utilice todos los subprocesos de consulta de la instancia de base de datos principal muestre un 90 % o más de utilización de la CPU, lo que indica que todos los subprocesos de consulta del servidor se dedican activamente a realizar un trabajo útil. Sin embargo, el uso real de la CPU suele ser algo inferior, incluso con una carga de escritura simultánea sostenida. Por lo general, esto se debe a que los subprocesos de consulta están esperando a que se completen I/O las operaciones del volumen de almacenamiento subyacente. Neptune utiliza escrituras de cuórum para realizar seis copias de los datos en tres zonas de disponibilidad, y cuatro de esos seis nodos de almacenamiento deben reconocer una escritura para que se considere duradera. Mientras un subproceso de consulta espera este cuórum desde el volumen de almacenamiento, se detiene, lo que reduce el uso de la CPU.

Si tiene una carga de escritura en serie en la que realiza una escritura tras otra y espera a que se complete la primera antes de comenzar la siguiente, es de esperar que la utilización de la CPU sea aún menor. La cantidad exacta dependerá de la cantidad de vCPU y subprocesos de consulta (cuantos más subprocesos de consulta, menos CPU total por consulta), y se reducirá en parte debido a la espera. I/O

Para obtener más información acerca de la mejor manera de dimensionar las instancias de base de datos, consulte Selección de tipos de instancia para Amazon Neptune. Para conocer los precios de cada tipo de instancia, consulte la página de precios de Neptune.

Monitorización del rendimiento de las instancias de base de datos en Neptune

Puede utilizar CloudWatch las métricas de Neptune para supervisar el rendimiento de las instancias de base de datos y realizar un seguimiento de la latencia de las consultas observada por el cliente. Consulte Utilización CloudWatch para supervisar el rendimiento de las instancias de base de datos en Neptune.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Ejemplos de transacciones

Almacenamiento, fiabilidad y disponibilidad