Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
In questo tutorial, avvierai un EMR cluster Amazon e utilizzerai Apache Hive per elaborare i dati archiviati in una tabella DynamoDB.
Hive è un'applicazione di data warehouse per Hadoop che consente di elaborare e analizzare i dati da più origini. Hive fornisce un linguaggio SQL simile a HiveQL che consente di lavorare con dati archiviati localmente nel EMR cluster Amazon o in un'origine dati esterna (come Amazon DynamoDB).
Per maggiori informazioni, vedi il tutorial Hive
Argomenti
Prima di iniziare
Per questo tutorial hai bisogno dei seguenti elementi:
-
AWS Un account. Se non lo hai, consulta Iscrizione a AWS.
-
Un SSH client (Secure Shell). Utilizzi il SSH client per connetterti al nodo leader del EMR cluster Amazon ed eseguire comandi interattivi. SSHi client sono disponibili per impostazione predefinita nella maggior parte delle installazioni Linux, Unix e Mac OS X. Gli utenti Windows possono scaricare e installare il TTY client Pu
, che dispone del SSH supporto.
Approfondimenti
Fase 1: creare una coppia di EC2 chiavi Amazon