Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Rubriques supplémentaires
Voici d'autres façons d'ajuster des applications qui utilisent Hive pour accéder à DynamoDB.
Retry duration (Durée de la nouvelle tentative)
Par défaut, Hive ré-exécute une tâche Hadoop qui n'a pas renvoyé de résultats de DynamoDB dans les deux minutes. Vous pouvez ajuster cet intervalle en modifiant le paramètre dynamodb.retry.duration
:
SET dynamodb.retry.duration=2;
La valeur doit être un entier différent de zéro représentant le nombre de minutes de l'intervalle de nouvelle tentative. La valeur par défaut de dynamodb.retry.duration
est 2 (minutes).
Demandes de données en parallèle
Plusieurs demandes de données adressées pas plusieurs utilisateurs ou plusieurs applications à une table unique peuvent réduire le débit de lecture approvisionné et ralentir les performances.
Durée du processus
La cohérence des données dans DynamoDB dépend de l'ordre des opérations de lecture et d'écriture sur chaque nœud. Quand une requête Hive est en cours, une autre application peut charger de nouvelles données dans la table DynamoDB, voire modifier ou supprimer des données existantes. Dans ce cas, les résultats de la requête Hive peuvent ne pas tenir compte des modifications apportées aux données pendant l'exécution de la requête.
Durée de la demande
La planification des requêtes Hive qui accèdent à une table DynamoDB à un moment où la demande sur celle-ci est inférieure a pour effet d'améliorer les performances. Par exemple, si la plupart des utilisateurs de votre application vivent à San Francisco, vous pouvez choisir d'exporter les données quotidiennes à 4h00 PST, lorsque la majorité des utilisateurs sont endormis et ne mettent pas à jour d'enregistrements dans votre base de données DynamoDB.