Directrices operativas básicas Determinación del tamaño de las instancias Uso de índices Prácticas recomendadas de seguridad Optimización de costos Uso de métricas para identificar los problemas de rendimiento TTL y cargas de trabajo de series temporales Migraciones Uso de grupos de parámetros de clúster Consultas de canalización de agregación BatchInsert y BatchUpdate

Prácticas recomendadas para Amazon DocumentDB

Conozca las prácticas recomendadas para trabajar con Amazon DocumentDB (compatible con MongoDB). Esta sección se actualiza continuamente a medida que se identifican nuevas prácticas recomendadas.

Temas

Directrices operativas básicas
Determinación del tamaño de las instancias
Uso de índices
Prácticas recomendadas de seguridad
Optimización de costos
Uso de métricas para identificar los problemas de rendimiento
TTL y cargas de trabajo de series temporales
Migraciones
Uso de grupos de parámetros de clúster
Consultas de canalización de agregación
BatchInsert y BatchUpdate

Directrices operativas básicas

A continuación se detallan las directrices operativas básicas que se deben seguir al trabajar con Amazon DocumentDB. El acuerdo de nivel de servicios de Amazon DocumentDB requiere que se sigan estas directrices.

Implemente un clúster compuesto por dos o más instancias de Amazon DocumentDB en dos zonas de AWS disponibilidad. Para cargas de trabajo de producción, recomendamos implementar un clúster que conste de tres o más instancias de Amazon DocumentDB en tres zonas de disponibilidad.
Utilice el servicio dentro de los límites de servicio indicados. Para obtener más información, consulte Cuotas y límites de Amazon DocumentDB.
Monitorice el uso de la memoria, la CPU, las conexiones y el almacenamiento. Para ayudarte a mantener el rendimiento y la disponibilidad del sistema, configura Amazon CloudWatch para que te notifique cuando cambien los patrones de uso o cuando te acerques a la capacidad de tu implementación.
Escale las instancias verticalmente cuando se esté acercando a los límites de la capacidad. Las instancias deben aprovisionarse con suficientes recursos informáticos (es decir, RAM, CPU, etc.) para adaptarse a aumentos imprevistos en la demanda de las aplicaciones.
Configure el periodo de retención de copia de seguridad para ajustarlo a su objetivo de punto de recuperación.
Pruebe la conmutación por error del clúster para comprender cuánto tiempo tarda el proceso en su caso de uso. Para obtener más información, consulte Conmutación por error a Amazon DocumentDB.
Conéctese al clúster de Amazon DocumentDB utilizando el punto de conexión del clúster (consulte Puntos de conexión de Amazon DocumentDB) y el modo de conjunto de réplicas (consulte Conexión a Amazon DocumentDB como conjunto de réplicas) para minimizar el impacto de una conmutación por error en la aplicación.
Elija una configuración de preferencia de lectura de controlador que maximice el escalado de lectura mientras cumple con los requisitos de coherencia de lectura de su aplicación. Las preferencias de lectura secondaryPreferred permiten las lecturas de réplica y libera la instancia principal para hacer más trabajo. Para obtener más información, consulte Opciones de preferencia de lectura.
Diseñe su aplicación para que sea resistente en el caso de que se produzcan errores de la red y de la base de datos. Utilice el mecanismo de errores del controlador para distinguir entre errores temporales y errores persistentes. Reintente los errores temporales mediante un mecanismo de retroceso exponencial cuando sea apropiado. Asegúrese de que la aplicación tenga en cuenta la coherencia de datos al implementar la lógica de reintentos.
Habilite la protección contra eliminación de clústeres para todos los clústeres de producción o cualquier clúster que tenga datos importantes. Antes de eliminar un clúster de Amazon DocumentDB, tome una instantánea final. Si va a implementar recursos con CloudFormation, habilite la protección de terminación. Para obtener más información, consulte Protección de terminación y protección de eliminación.
Cuando crea un clúster de Amazon DocumentDB, la --engine-version es un parámetro opcional que es el valor predeterminado de la última versión principal del motor. La versión predeterminada actual del motor es 5.0.0 (nota: Amazon DocumentDB 8.0 está disponible, pero debe especificarse de forma explícita). Cuando se publiquen nuevas versiones principales del motor, la versión del motor predeterminada para --engine-version se actualizará para reflejar la última versión principal del motor. En consecuencia, para las cargas de trabajo de producción, y especialmente las que dependen de la creación de scripts, la automatización o CloudFormation las plantillas, le recomendamos que especifique de forma explícita la versión principal --engine-version prevista.

Determinación del tamaño de las instancias

Uno de los aspectos más importantes a la hora de elegir un tamaño de instancia en Amazon DocumentDB es la cantidad de RAM de la memoria caché. Amazon DocumentDB reserva un tercio de la RAM para sus propios servicios, lo que significa que solo dos tercios de la RAM de la instancia están disponibles para la memoria caché. Es una práctica recomendada de rendimiento de Amazon DocumentDB elegir un tipo de instancia con suficiente RAM para que su conjunto de trabajo (es decir, datos e índices) quepa en la memoria. Disponer de instancias del tamaño adecuado ayudará a optimizar el rendimiento general y, potencialmente, a minimizar los I/O costes. Puede utilizar la calculadora de tamaño de Amazon DocumentDB de terceros para estimar el tamaño de la instancia para una carga de trabajo concreta.

Para determinar si el conjunto de trabajo de su aplicación cabe en la memoria, supervise el BufferCacheHitRatio uso de Amazon CloudWatch para cada instancia de un clúster que esté bajo carga.

La BufferCacheHitRatio CloudWatch métrica mide el porcentaje de datos e índices servidos desde la caché de memoria de una instancia (en comparación con el volumen de almacenamiento). En términos generales, el valor de BufferCacheHitRatio debe ser lo más alto posible, ya que la lectura de datos de la memoria del conjunto de trabajo es más rápida y rentable que la lectura del volumen de almacenamiento. Si bien es deseable mantener BufferCacheHitRatio lo más cerca posible del 100 %, el mejor valor alcanzable dependerá de los patrones de acceso y los requisitos de rendimiento de su aplicación. Para mantener el BufferCacheHitRatio más alto posible, se recomienda que las instancias del clúster cuenten con suficiente RAM para poder ajustar los índices y el conjunto de datos de trabajo en la memoria.

Si sus índices no caben en la memoria, verá un valor de BufferCacheHitRatio inferior. La lectura continua desde el disco conlleva I/O costes adicionales y no es mejor que la lectura desde la memoria. Si la proporción de BufferCacheHitRatio es inferior a la esperada, escale verticalmente el tamaño de la instancia del clúster para proporcionar más RAM, de forma que los datos del conjunto de trabajo quepan en la memoria. Si escalar la clase de instancia provoca un aumento drástico de BufferCacheHitRatio, entonces el conjunto de trabajo de su aplicación no cabe en la memoria. Continúe con el escalado vertical hasta que BufferCacheHitRatio ya no aumente drásticamente después de una operación de escalado. Para obtener información acerca del monitoreo de las métricas de una instancia, consulte Métricas de Amazon DocumentDB.

Dependiendo de la carga de trabajo y los requisitos de latencia, puede ser aceptable que la aplicación tenga valores más altos de BufferCacheHitRatio durante el uso de estado constante, pero tenga una caída periódica de BufferCacheHitRatio a medida que las consultas analíticas que necesitan analizar una colección completa se ejecutan en una instancia. Estas caídas periódicas en BufferCacheHitRatio pueden manifestarse como una latencia más alta para consultas posteriores que necesitan volver a llenar los datos del conjunto de trabajo desde el volumen de almacenamiento de nuevo en la caché del búfer. Le recomendamos que pruebe las cargas de trabajo en un entorno de preproducción con una carga de trabajo de producción representativa primero, para comprender las características de rendimiento y BufferCacheHitRatio antes de implementar la carga de trabajo en producción.

BufferCacheHitRatio es una métrica específica de instancia, por lo que las distintas instancias dentro del mismo clúster pueden tener valores de BufferCacheHitRatio diferentes, dependiendo de cómo se distribuyen las lecturas entre la instancia principal y la de réplica. Si la carga de trabajo operativa no puede controlar los aumentos periódicos de latencia por volver a llenar la caché del conjunto de trabajo después de ejecutar consultas analíticas, debe intentar aislar la caché del búfer de la carga de trabajo normal de la de las consultas analíticas. Puede lograr un aislamiento completo de BufferCacheHitRatio dirigiendo las consultas operativas a la instancia principal y las consultas analíticas solo a las instancias de réplica. También puede lograr un aislamiento parcial dirigiendo consultas analíticas a una instancia de réplica específica, entendiendo que un porcentaje de consultas regulares también se ejecutarán en esa réplica y podrían verse afectadas.

Los valores adecuados de BufferCacheHitRatio dependen del caso de uso y los requisitos de la aplicación. No hay un valor máximo o mínimo para esta métrica; solo usted puede decidir si la compensación de un valor de BufferCacheHitRatio temporalmente inferior es aceptable desde una perspectiva de costo y rendimiento.

Uso de índices

Creación de índices

Al importar datos en Amazon DocumentDB, debe crear los índices antes de importar grandes conjuntos de datos. Puede utilizar la herramienta de índices de Amazon DocumentDB para extraer índices de una instancia de MongoDB en ejecución o de un directorio mongodump, y crear dichos índices en un clúster de Amazon DocumentDB. Para obtener más información acerca de las migraciones, consulte Migración a Amazon DocumentDB.

Selectividad de índice

Se recomienda limitar la creación de índices a campos donde el número de valores duplicados sea inferior al 1 % del número total de documentos de la colección. Por ejemplo, si la colección cuenta con 100 000 documentos, solo cree índices en campos donde el mismo valor se produzca 1000 veces o menos.

Elegir un índice con un alto número de valores únicos (es decir, una alta cardinalidad) garantiza que las operaciones de filtro devuelvan un pequeño número de documentos, con lo que se obtiene un buen rendimiento durante los análisis de índices. Un ejemplo de un índice de alta cardinalidad es un índice único, que garantiza que los predicados de igualdad devuelvan como máximo un documento único. Entre los ejemplos de baja cardinalidad se incluyen un índice sobre un campo booleano y un índice sobre el día de la semana. Debido a su bajo rendimiento, es poco probable que el optimizador de consultas de la base de datos elija índices de cardinalidad baja. Al mismo tiempo, los índices de cardinalidad bajos siguen consumiendo recursos como espacio en disco y. I/Os Como regla general, debe aplicar los índices a campos donde la frecuencia del valor típica sea un 1 % del tamaño total de la colección o menos.

Además, se recomienda crear índices únicamente en campos que se utilizan comúnmente como filtro y buscar regularmente índices no utilizados. Para obtener más información, consulte ¿Cómo analizo el uso de los índices e identifico los índices no utilizados?.

Impacto de los índices en los datos de escritura

Aunque los índices pueden mejorar el rendimiento de las consultas al evitar la necesidad de examinar todos los documentos de una colección, esta mejora tiene algún inconveniente. Para cada índice de una colección, cada vez que se inserta, actualiza o elimina un documento, la base de datos debe actualizar la colección y escribir los campos en cada uno de los índices de la colección. Por ejemplo, si una colección tiene nueve índices, la base de datos debe realizar diez escrituras antes de validar la operación para el cliente. Por lo tanto, cada índice adicional genera una latencia de escritura adicional y un aumento en el almacenamiento total utilizado. I/O

Las instancias del clúster deben tener el tamaño adecuado para mantener toda la memoria del conjunto de trabajo. Esto evita la necesidad de leer continuamente las páginas de índice del volumen de almacenamiento, lo que repercute negativamente en el rendimiento y genera I/O costes más altos. Para obtener más información, consulte Determinación del tamaño de las instancias.

Para obtener un mejor rendimiento, reduzca el número de índices de sus colecciones, agregando solo los índices necesarios para mejorar el rendimiento de las consultas comunes. Aunque las cargas de trabajo varían, una buena directriz es mantener el número de índices por colección en cinco o menos.

Identificación de índices que faltan

Identificar y eliminar los índices que faltan es una práctica recomendada que aconsejamos realizar de forma periódica. Para obtener más información, consulte ¿Cómo identifico los índices que faltan?.

Identificación de índices no utilizados

Identificar y eliminar índices no utilizados es una práctica recomendada que aconsejamos realizar de forma periódica. Para obtener más información, consulte ¿Cómo analizo el uso de los índices e identifico los índices no utilizados?.

Prácticas recomendadas de seguridad

Como prácticas recomendadas de seguridad, debe usar cuentas AWS Identity and Access Management (IAM) para controlar el acceso a las operaciones de la API de Amazon DocumentDB, especialmente las operaciones que crean, modifican o eliminan los recursos de Amazon DocumentDB. Dichos recursos incluyen clústeres, grupos de seguridad y grupos de parámetros. Debe utilizar también IAM para controlar las acciones administrativas comunes como la restauración de las copias de seguridad de los clústeres. Al crear roles de IAM, utilice el principio de privilegios mínimos.

Imponga privilegios mínimos con control de acceso basado en roles.
Asigne una cuenta de IAM individual a cada persona que administre los recursos de Amazon DocumentDB. No utilice el usuario Cuenta de AWS raíz para administrar los recursos de Amazon DocumentDB. Cree un usuario de IAM para todos, incluido usted mismo.
Conceda a cada usuario de IAM el conjunto mínimo de permisos requerido para realizar sus tareas.
Use los grupos de IAM para administrar con eficacia los permisos para varios usuarios. Para obtener más información acerca de IAM, consulte la Guía del usuario de IAM. Para obtener información sobre las prácticas recomendadas de IAM, consulte Prácticas recomendadas de IAM.
Rote con regularidad sus credenciales de IAM.
Configure AWS Secrets Manager para rotar automáticamente los secretos de Amazon DocumentDB. Para obtener más información, consulte Rotating Your AWS Secrets Manager Secrets Secrets y Rotating Secrets for Amazon DocumentDB en la Guía del usuario de AWS Secrets Manager.
Conceda a cada usuario de Amazon DocumentDB el conjunto mínimo de permisos requerido para realizar sus tareas. Para obtener más información, consulte Acceso a la base de datos mediante el control de Role-Based acceso.
Utilice Transport Layer Security (TLS) para cifrar los datos en tránsito y AWS KMS los datos en reposo.

Optimización de costos

Las siguientes prácticas recomendadas pueden ayudarlo a administrar y minimizar sus costos cuando utilice Amazon DocumentDB. Para obtener información sobre precios, consulte los precios de Amazon DocumentDB (compatible con MongoDB) y las preguntas frecuentes sobre Amazon DocumentDB (compatible con MongoDB).

Cree alertas de facturación en umbrales del 50 y el 75 % de su factura prevista para el mes. Para obtener más información sobre la creación de alertas de facturación, consulte Creación de una alarma de facturación.
La arquitectura de Amazon DocumentDB separa el almacenamiento y la computación, por lo que incluso un clúster de una sola instancia es muy duradero. El volumen de almacenamiento del clúster replica los datos de seis formas en tres zonas de disponibilidad, lo que proporciona una durabilidad extremadamente alta con independencia del número de instancias del clúster. Un clúster típico de producción tiene tres o más instancias para proporcionar alta disponibilidad. Sin embargo, puede optimizar los costes mediante un clúster de desarrollo de una única instancia cuando no se requiera alta disponibilidad.
En las situaciones de desarrollo y pruebas, detenga un clúster cuando ya no sea necesario e inícielo cuando se reanude el desarrollo. Para obtener más información, consulte Detención e inicio de un clúster de bases de datos de Amazon DocumentDB.
Tanto el TTL como el flujo de cambios se producen I/O cuando se escriben, leen y eliminan datos. Si ha habilitado estas características pero no las está utilizando en la aplicación, su desactivación puede ayudar a reducir los costos.

Uso de métricas para identificar los problemas de rendimiento

Temas

Visualización de métricas de rendimiento
Configurar una CloudWatch alarma
Evaluación de las métricas de rendimiento
Evaluación del uso de instancias de Amazon DocumentDB con métricas CloudWatch
Ajuste de consultas

Para identificar los problemas de rendimiento causados por la falta de recursos y otros cuellos de botella frecuentes, puede monitorizar las métricas disponibles para su clúster de base de datos de Amazon DocumentDB.

Visualización de métricas de rendimiento

Monitorice las métricas de desempeño con frecuencia para ver los valores medios, máximos y mínimos de diversos intervalos de tiempo. Esto lo ayuda a identificar cuándo se degrada el rendimiento. También puedes configurar CloudWatch las alarmas de Amazon para determinados umbrales de métricas, de forma que recibas una alerta si se alcanzan.

Para solucionar los problemas de rendimiento, es importante conocer el desempeño de referencia del sistema. Después de configurar un nuevo clúster y ponerlo en marcha con una carga de trabajo típica, capture los valores promedio, máximo y mínimo de todas las métricas de rendimiento en diferentes intervalos (por ejemplo, 1 hora, 24 horas, 1 semana, 2 semanas). Esto permite hacerse una idea de lo que es normal. Ayuda a obtener comparaciones para las horas con picos y valles de funcionamiento. Puede usar esta información para saber cuándo cae el desempeño por debajo de los niveles estándar.

Para ver las métricas de rendimiento, utilice la Consola de administración de AWS tecla o. AWS CLI Para obtener más información, consulte Visualización CloudWatch de datos.

Configurar una CloudWatch alarma

Para configurar una CloudWatch alarma, consulta Uso de Amazon CloudWatch Alarms en la Guía del CloudWatch usuario de Amazon.

Evaluación de las métricas de rendimiento

Una instancia tiene varias categorías diferentes de métricas. La forma de determinar los valores aceptables depende de la métrica.

CPU

Utilización de la CPU: el porcentaje de la capacidad de procesamiento del equipo que está en uso.

Memoria

Memoria que se puede liberar: cuánta RAM está disponible en la instancia.
Uso del espacio de intercambio: cuánto espacio de intercambio usa la instancia en megabytes.

Input/output operaciones

IOPS de lectura, IOPS de escritura: número medio de operaciones de lectura o escritura en disco por segundo.
Latencia de lectura, latencia de escritura: tiempo medio de una operación de lectura o escritura en milisegundos.
Rendimiento de lectura, rendimiento de escritura: número medio de megabytes leídos o escritos en el disco por segundo.
Profundidad de cola de discos: número de I/O operaciones que están esperando a escribirse o leerse desde el disco.

Tráfico de red

Rendimiento de recepción de la red, rendimiento de transmisión de la red: velocidad del tráfico de red de entrada y salida de la instancia de base de datos en megabytes por segundo.

Conexiones a base de datos

Conexiones a base de datos: número de sesiones cliente que están conectadas a la instancia de base de datos.

En general, los valores aceptables para las métricas de desempeño dependen del aspecto de la referencia y de lo que hace la aplicación. Investigue las variaciones coherentes o de las tendencias con respecto a la referencia.

A continuación, se ofrecen algunas recomendaciones y sugerencias sobre tipos concretos de métricas:

Consumo elevado de CPU: unos valores elevados de consumo de CPU pueden ser adecuados si se ajustan a los objetivos de su aplicación (de rendimiento o simultaneidad, por ejemplo) y son los esperados. Si el consumo de CPU es sistemáticamente superior al 80 %, valore la posibilidad de escalar las instancias.
Consumo elevado de RAM: si la métrica FreeableMemory se sitúa con frecuencia por debajo del 10% de la memoria total de la instancia, valore la posibilidad de escalar las instancias. Para obtener más información sobre lo que ocurre cuando su instancia de DocumentDB sufre una gran presión de memoria, consulte Amazon DocumentDB Resource Governance.
Uso de intercambio: esta métrica debe mantenerse en cero o en un valor próximo a cero. Si el uso que hace del intercambio es significativo, valore la posibilidad de escalar las instancias.
Tráfico de red: para el tráfico de red, hable con el administrador de su sistema para saber cuál es el rendimiento esperado para la red de su dominio y para su conexión a Internet. Investigue el tráfico de red si el rendimiento es por sistema inferior al esperado.
Conexiones a bases de datos: valore la posibilidad de restringir las conexiones a las bases de datos si ve que hay un alto número de conexiones de usuarios junto con una reducción en el rendimiento y el tiempo de respuesta de la instancia. El mejor número de conexiones de usuarios para su instancia varía en función de la clase de instancia y de la complejidad de las operaciones que se estén llevando a cabo. Si hay problemas con cualquier métrica de desempeño, una de las primeras cosas que debe hacer para mejorar el desempeño es ajustar las consultas más frecuentes y más caras para ver si eso reduce la presión existente en los recursos del sistema.

Si sus consultas están ajustadas y el problema persiste, considere la posibilidad de actualizar la clase de instancia de Amazon DocumentDB a una con más recursos (CPU, RAM, espacio en disco, ancho de banda de red, I/O capacidad) relacionados con el problema que está experimentando.

Evaluación del uso de instancias de Amazon DocumentDB con métricas CloudWatch

Puede usar CloudWatch las métricas para observar el rendimiento de su instancia y descubrir si su clase de instancia proporciona recursos suficientes para sus aplicaciones. Para obtener información sobre los límites de la clase de instancia, vaya a Límites de instancias y busque las especificaciones de la clase de instancia para encontrar el rendimiento de la red.

Si el uso de la instancia está cerca del límite de las clases de instancia, es posible que el rendimiento comience a disminuir. Las CloudWatch métricas pueden confirmar esta situación, por lo que puedes planificar la ampliación manual a una clase de instancias más grande.

Combina los siguientes valores de CloudWatch métricas para saber si te estás acercando al límite de clases de instancias:

NetworkThroughput—La cantidad de rendimiento de red que reciben y transmiten los clientes para cada instancia del clúster de Amazon DocumentDB. Este valor de rendimiento no incluye el tráfico de red entre las instancias del clúster y el volumen de almacenamiento del clúster.
StorageNetworkThroughput—La cantidad de rendimiento de red recibida y enviada al volumen de almacenamiento del clúster de Amazon DocumentDB por cada instancia del clúster de Amazon DocumentDB.

Añada el NetworkThroughputal StorageNetworkThroughputpara encontrar el rendimiento de red recibido y enviado al volumen de almacenamiento del clúster de Amazon DocumentDB por cada instancia de su clúster de Amazon DocumentDB. El límite de clases de instancia para su instancia debe ser mayor que la suma de estas dos métricas combinadas.

Puede utilizar las siguientes métricas para revisar detalles adicionales del tráfico de red de las aplicaciones cliente al enviar y recibir:

NetworkReceiveThroughput—La cantidad de rendimiento de red que recibe de los clientes cada instancia del clúster de Amazon DocumentDB. Este rendimiento no incluye el tráfico de red entre las instancias del clúster y el volumen de almacenamiento del clúster.
NetworkTransmitThroughput—La cantidad de rendimiento de red que envía a los clientes cada instancia del clúster de Amazon DocumentDB. Este rendimiento no incluye el tráfico de red entre las instancias del clúster y el volumen de almacenamiento del clúster.
StorageNetworkReceiveThroughput—La cantidad de rendimiento de red recibida del volumen de almacenamiento del clúster de Amazon DocumentDB por cada instancia del clúster.
StorageNetworkTransmitThroughput—La cantidad de rendimiento de red que cada instancia del clúster envía al volumen de almacenamiento del clúster de Amazon DocumentDB.

Sume todas estas métricas para evaluar cómo está el uso de la red con respecto al límite de las clases de instancias. El límite de las clases de instancias debe ser mayor que la suma de estas métricas combinadas.

Los límites de la red y el uso de la CPU por una instancia son mutuos. Cuando aumenta el rendimiento de la red, también aumenta la utilización de la CPU. La supervisión del uso de la CPU y la red proporciona información sobre cómo y por qué se agotan los recursos.

Para ayudar a minimizar el uso de la red, puede considerar lo siguiente:

Utilizar una clase de instancia mayor.
Dividir las solicitudes de escritura en lotes para reducir las transacciones generales.
Redirigir la carga de trabajo de solo lectura a una instancia de solo lectura.
Eliminar los índices no utilizados.

Ajuste de consultas

Una de las formas más eficaces de mejorar el rendimiento de clúster es ajustar las consultas más utilizadas y que más recursos consumen para que ejecutarlas resulte más económico.

Puede utilizar el generador de perfiles (consulte Creación de perfiles de operaciones en Amazon DocumentDB) para registrar el tiempo de ejecución y los detalles de las operaciones realizadas en el clúster. El generador de perfiles es útil para monitorizar las operaciones más lentas del clúster para ayudarle a mejorar el rendimiento de las consultas individuales y el rendimiento general del clúster.

También puede utilizar el comando explain para descubrir cómo analizar un plan de consulta para una determinada consulta. Utilice esta información para modificar una consulta o una colección subyacente con el fin de mejorar el rendimiento de las consultas (por ejemplo, cómo añadir un índice).

TTL y cargas de trabajo de series temporales

La eliminación de documentos resultante del vencimiento del índice TTL es un proceso muy laborioso. No se garantiza la eliminación de documentos dentro de un periodo específico. Factores como el tamaño de la instancia, la utilización de recursos de la instancia, el tamaño del documento, el rendimiento general, el número de índices y si los índices y el conjunto de trabajo caben en la memoria pueden afectar al momento en el que el proceso TTL elimina los documentos caducados.

Cuando el monitor TTL elimina sus documentos, cada eliminación conlleva I/O costos, lo que aumenta su factura. Si el rendimiento y las tasas de borrado por TTL aumentan, cabe esperar una factura más alta debido al aumento del uso. I/O Sin embargo, si no crea un índice TTL para eliminar documentos, sino que los segmenta en colecciones en función del tiempo y simplemente elimina esas colecciones cuando ya no las necesita, no incurrirá en ningún costo de E/S. Esto puede resultar considerablemente más rentable que utilizar un índice TTL.

Para las cargas de trabajo de series temporales, puede considerar la posibilidad de crear recopilaciones sucesivas en lugar de un índice TTL, ya que las recopilaciones sucesivas pueden ser una forma mejor de eliminar datos y ser menos intensivas. I/O Si tiene colecciones de gran tamaño (especialmente aquellas de más de 1 TB) o si le preocupan I/O los costes de eliminación del TTL, le recomendamos que divida los documentos en colecciones en función del tiempo y que elimine las recopilaciones cuando los documentos ya no los necesite. Puede crear una colección por día o una por semana, dependiendo de su tasa de incorporación de datos. Aunque los requisitos varían en función de su aplicación, una buena regla general es tener colecciones más pequeñas en lugar de unas pocas colecciones grandes. Eliminar estas recopilaciones no implica I/O costes y puede ser más rápido y rentable que utilizar un índice TTL.

Migraciones

Como práctica recomendada, recomendamos que al migrar datos a Amazon DocumentDB, primero cree los índices en Amazon DocumentDB antes de migrar los datos. Crear los índices en primer lugar puede reducir el tiempo general y aumentar la velocidad de la migración. Para hacer esto, puede usar la Herramienta de índice de Amazon DocumentDB. Para obtener más información sobre las migraciones, consulte la Guía de migración de Amazon DocumentDB.

También le recomendamos que antes de migrar la base de datos de producción, se recomienda probar completamente la aplicación en Amazon DocumentDB, teniendo en cuenta la funcionalidad, el rendimiento, las operaciones y el costo.

Uso de grupos de parámetros de clúster

Es recomendable que pruebe los cambios de los grupos de parámetros de clúster en un clúster de prueba antes de aplicarlos en los clústeres de producción. Para obtener información acerca del procedimiento para realizar la copia de seguridad del clúster, consulte Copia de seguridad y restauración en Amazon DocumentDB.

Consultas de canalización de agregación

Si crea una consulta de canalización de agregación con varias etapas y evalúa un solo subconjunto de los datos de la consulta, utilice la etapa $match como primera etapa o al principio de la canalización. Usar primero $match reducirá el número de documentos que las etapas posteriores tendrán que procesar dentro de la consulta de canalización de agregación, mejorando así el rendimiento de su consulta.

`BatchInsert y BatchUpdate`

Al realizar una alta tasa de batchInsert and/or batchUpdate operaciones simultáneas y la cantidad FreeableMemory (CloudWatch métrica) se reduce a cero en la instancia principal, puede reducir la simultaneidad de la carga de trabajo de inserción o actualización por lotes o, si no se puede reducir la simultaneidad de la carga de trabajo, aumentar el tamaño de la instancia para aumentar la cantidad de. FreeableMemory

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Transacciones

Diferencias funcionales con MongoDB