Temas adicionales - Amazon DynamoDB

Temas adicionales

A continuación se muestran otras maneras de ajustar las aplicaciones que utilizan Hive para acceder a DynamoDB.

Retry duration

De forma predeterminada, Hive vuelve a ejecutar un trabajo de Hadoop si este no devuelve resultados de DynamoDB en un plazo de dos minutos. Puede ajustar este intervalo modificando el parámetro dynamodb.retry.duration:

SET dynamodb.retry.duration=2;

El valor debe ser un número entero distinto de cero que represente el número de minutos del intervalo de reintento. El valor predeterminado de dynamodb.retry.duration es 2 (minutos).

Solicitudes de datos paralelas

Varias solicitudes de datos a una única tabla, ya sean de más de un usuario o de más de una aplicación, podrían agotar el desempeño de lectura provisionado y ralentizar el desempeño.

Duración del proceso

La consistencia de datos en DynamoDB depende del orden de las operaciones de lectura y escritura en cada nodo. Aunque haya una consulta de Hive en curso, otra aplicación podría cargar nuevos datos en la tabla de DynamoDB o modificar o eliminar datos existentes. En este caso, los resultados de la consulta de Hive podrían no reflejar los cambios realizados en los datos mientras se ejecutaba la consulta.

Tiempo de solicitud

Programar las consultas de Hive que acceden a una tabla de DynamoDB de modo que se lleven a cabo en aquellos momentos en que la demanda de esa tabla de DynamoDB es más baja, mejora el rendimiento. Por ejemplo, si la mayoría de los usuarios de la aplicación viven en San Francisco, podría elegir exportar los datos diarios a las 4.00 h PST, cuando la mayoría de los usuarios duerme y no actualizan los registros de la base de datos de DynamoDB.