Tutorial: Arbeiten mit Amazon DynamoDB und Apache Hive

In diesem Tutorial starten Sie einen Amazon-EMR-Cluster und verwenden Apache Hive zum Verarbeiten von Daten in einer DynamoDB-Tabelle.

Hive ist eine Data-Warehouse-Anwendung für Hadoop, mit der Sie Daten aus mehreren Quellen verarbeiten und analysieren können. Hive bietet eine SQL-like Sprache, HiveQL, mit Daten, die lokal im Amazon EMR-Cluster oder in einer externen Datenquelle (wie Amazon DynamoDB) gespeichert sind, arbeiten können.

Weitere Informationen finden Sie im Hive-Tutorial.

Themen

Bevor Sie beginnen

Für dieses Tutorial benötigen Sie Folgendes:

AWS Ein Konto. Wenn Sie kein Konto haben, finden Sie weitere Informationen unter Melde dich an für ein AWS-Konto.
Einen SSH-Client (Secure Shell). Sie verwenden den SSH-Client, um eine Verbindung mit dem Leader-Knoten des Amazon-EMR-Clusters herzustellen und interaktive Befehle auszuführen. In den meisten Linux-, Unix- und Mac-OS-X-Installationen sind SSH-Clients standardmäßig vorhanden. Windows-Benutzer können den PuTTY-Client, der SSH unterstützt, herunterladen und installieren.

Nächster Schritt

Schritt 1: Erstellen eines Amazon EC2-Schlüsselpaares

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Integration in Amazon EMR

Schritt 1: Erstellen eines Amazon EC2-Schlüsselpaares