Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Personnalisation de performances
Lorsque vous créez une table externe Hive qui mappe à une table DynamoDB, vous ne consommez aucune capacité de lecture ou d'écriture de DynamoDB. Cependant, l'activité de lecture et d'écriture sur la table Hive (telle que INSERT
ou SELECT
) se traduit directement en opérations de lecture et d'écriture sur la table DynamoDB sous-jacente.
Apache Hive sur Amazon EMR met en œuvre sa propre logique pour équilibrer la charge d'E/S sur la table DynamoDB et cherche à minimiser le risque de dépassement du débit provisionné de la table. À la fin de chaque requête Hive, Amazon EMR renvoie des indicateurs d'exécution, notamment le nombre de fois où le débit alloué a été dépassé. Vous pouvez utiliser ces informations, ainsi que les CloudWatch mesures de votre table DynamoDB, pour améliorer les performances lors des demandes suivantes.
La EMR console Amazon fournit des outils de surveillance de base pour votre cluster. Pour plus d'informations, consultez Afficher et surveiller un cluster dans le guide EMR de gestion Amazon.
Vous pouvez également surveiller vos tâches de cluster et Hadoop à l'aide d'outils web tels que Hue, Ganglia et l'interface web Hadoop. Pour plus d'informations, consultez Afficher les interfaces Web hébergées sur des EMR clusters Amazon dans le guide EMR de gestion Amazon.
Cette section décrit la procédure à suivre pour ajuster les performances des opérations Hive sur des tables DynamoDB externes.