Didacticiel : Utilisation d'Amazon DynamoDB et d'Apache Hive - Amazon DynamoDB

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Didacticiel : Utilisation d'Amazon DynamoDB et d'Apache Hive

Dans ce didacticiel, vous allez lancer un EMR cluster Amazon, puis utiliser Apache Hive pour traiter les données stockées dans une table DynamoDB.

Hive est une application d'entrepôt de données pour Hadoop, qui vous permet de traiter et d'analyser des données de plusieurs sources. Hive fournit un langage SQL similaire, HiveQL, qui vous permet de travailler avec des données stockées localement dans le cluster EMR Amazon ou dans une source de données externe (telle qu'Amazon DynamoDB).

Pour plus d'informations, consultez le Didacticiel Hive.

Avant de commencer

Pour ce didacticiel, vous avez besoin des éléments suivants :

  • Un AWS compte. Si vous n'en avez pas, consultez S'inscrire à AWS.

  • Un SSH client (Secure Shell). Vous utilisez le SSH client pour vous connecter au nœud principal du EMR cluster Amazon et exécuter des commandes interactives. SSHles clients sont disponibles par défaut sur la plupart des installations Linux, Unix et Mac OS X. Les utilisateurs de Windows peuvent télécharger et installer le TTY client Pu, qui est pris SSH en charge.

Étape suivante

Étape 1 : créer une paire de EC2 clés Amazon