Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Didacticiel : Utilisation d'Amazon DynamoDB et d'Apache Hive
Dans ce didacticiel, vous allez lancer un EMR cluster Amazon, puis utiliser Apache Hive pour traiter les données stockées dans une table DynamoDB.
Hive est une application d'entrepôt de données pour Hadoop, qui vous permet de traiter et d'analyser des données de plusieurs sources. Hive fournit un langage SQL similaire, HiveQL, qui vous permet de travailler avec des données stockées localement dans le cluster EMR Amazon ou dans une source de données externe (telle qu'Amazon DynamoDB).
Pour plus d'informations, consultez le Didacticiel Hive
Rubriques
- Avant de commencer
- Étape 1 : créer une paire de EC2 clés Amazon
- Étape 2 : Lancer un EMR cluster Amazon
- Étape 3 : se connecter au nœud leader
- Étape 4 : Charger les données dans HDFS
- Étape 5 : copier des données dans DynamoDB
- Étape 6 : interroger les données dans la table DynamoDB
- Étape 7 : (Facultatif) nettoyer
Avant de commencer
Pour ce didacticiel, vous avez besoin des éléments suivants :
-
Un AWS compte. Si vous n'en avez pas, consultez S'inscrire à AWS.
-
Un SSH client (Secure Shell). Vous utilisez le SSH client pour vous connecter au nœud principal du EMR cluster Amazon et exécuter des commandes interactives. SSHles clients sont disponibles par défaut sur la plupart des installations Linux, Unix et Mac OS X. Les utilisateurs de Windows peuvent télécharger et installer le TTY client Pu
, qui est pris SSH en charge.
Étape suivante
Étape 1 : créer une paire de EC2 clés Amazon