Tutorial: Utilizzo di Amazon DynamoDB e Apache Hive

In questo tutorial, viene avviato un cluster Amazon EMR e quindi si utilizza Apache Hive per elaborare i dati archiviati in una tabella DynamoDB.

Hive è un'applicazione di data warehouse per Hadoop che consente di elaborare e analizzare i dati da più origini. Hive fornisce un SQL-like linguaggio, HiveQL, che consente di lavorare con i dati archiviati localmente nel cluster Amazon EMR o in un'origine dati esterna (come Amazon DynamoDB).

Per maggiori informazioni, vedi il tutorial Hive.

Argomenti

Prima di iniziare

Per questo tutorial hai bisogno dei seguenti elementi:

AWS Un account. Se non lo hai, consulta Iscriviti per un Account AWS.
Un client SSH (Secure Shell). È possibile utilizzare il client SSH per connettersi al nodo principale del cluster Amazon EMR ed eseguire comandi interattivi. I client SSH sono disponibili per impostazione predefinita nella maggior parte delle installazioni Linux, Unix e Mac OS X. Gli utenti Windows possono scaricare e installare il client PuTTY, che ha il supporto SSH.

Approfondimenti

Fase 1: Creazione di una coppia di chiavi di Amazon EC2

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Integrazione con Amazon EMR

Fase 1: Creazione di una coppia di chiavi di Amazon EC2