Personnalisation de performances

Lorsque vous créez une table externe Hive qui mappe à une table DynamoDB, vous ne consommez aucune capacité de lecture ou d’écriture de DynamoDB. Cependant, l’activité de lecture et d’écriture sur la table Hive (telle que INSERT ou SELECT) se traduit directement en opérations de lecture et d’écriture sur la table DynamoDB sous-jacente.

Apache Hive sur Amazon EMR met en œuvre sa propre logique pour équilibrer I/O la charge sur la table DynamoDB et cherche à minimiser le risque de dépassement du débit provisionné de la table. À la fin de chaque requête Hive, Amazon EMR renvoie les métriques d’exécution, dont le nombre de fois que votre débit approvisionné a été dépassé. Vous pouvez utiliser ces informations, ainsi que les CloudWatch mesures de votre table DynamoDB, pour améliorer les performances lors des demandes suivantes.

La console Amazon EMR fournit des outils de surveillance de base pour votre cluster. Pour plus d’informations, consultez Affichage et surveillance d’un cluster dans le Guide de gestion Amazon EMR.

Vous pouvez également surveiller vos tâches de cluster et Hadoop à l’aide d’outils web tels que Hue, Ganglia et l’interface web Hadoop. Pour plus d’informations, consultez Affichage des interfaces web hébergées sur les clusters Amazon EMR dans le Guide de gestion Amazon EMR.

Cette section décrit la procédure à suivre pour ajuster les performances des opérations Hive sur des tables DynamoDB externes.

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Lecture de données de caractères non imprimables UTF-8

Débit alloué DynamoDB