Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Den Hive-JDBC-Treiber verwenden
Sie können beliebte Business Intelligence-Tools wie Microsoft Excel, MicroStrategyQlikView, und Tableau mit Amazon EMR verwenden, um Ihre Daten zu untersuchen und zu visualisieren. Viele dieser Tools erfordern einen Java Database Connectivity (JDBC)- oder einen Open Database Connectivity (ODBC)-Treiber. Amazon EMR unterstützt JDBC- und ODBC-Verbindungen.
Das folgende Beispiel zeigt die Verwendung von SQL Workbench/J als SQL-Client zum Verbinden eines Hive-Clusters in Amazon EMR. Weitere Treiber finden Sie unter Verwenden von Business-Intelligence-Tools mit Amazon EMR.
Bevor Sie SQL Workbench/J installieren und damit arbeiten, laden Sie das Treiber-Paket herunter, und installieren Sie den Treiber. Die in dem Paket enthaltenen Treiber unterstützen die Hive-Versionen, die in den Amazon-EMR-Versionen 4.0 und höher verfügbar sind. Detaillierte Versionshinweise und Dokumentationen finden Sie in der PDF-Dokumentation in dem Paket.
-
Das neueste Hive-JDBC-Treiberpaket herunterladen
http://awssupportdatasvcs.com/bootstrap-actions/Simba/latest/
-
Ältere Versionen des Hive-JDBC-Treibers
So installieren und konfigurieren Sie die SQL Workbench
-
Laden Sie über http://www.sql-workbench.net/downloads.html
den SQL Workbench/J-Client für Ihr Betriebssystem herunter. -
Installieren Sie SQL Workbench/J. Weitere Informationen finden Sie unter Installieren und Starten von SQL Workbench/J
im Benutzerhandbuch für SQL Workbench/J. -
Linux-, Unix-, Mac OS X-Benutzer: Erstellen Sie mithilfe des folgenden Befehls in einer Terminalsitzung einen SSH-Tunnel zum Master-Knoten Ihres Clusters.
master-public-dns-name
Ersetzen Sie durch den öffentlichen DNS-Namen des Master-Knotens undpath-to-key-file
durch den Speicherort und den Dateinamen Ihrer Amazon EC2 Private Key (.pem
) -Datei.ssh -o ServerAliveInterval=10 -i
path-to-key-file
-N -L 10000:localhost:10000 hadoop@master-public-dns-name
Windows-Benutzer: Erstellen Sie in einer PuTTY-Sitzung einen SSH-Tunnel zum Hauptknoten Ihres Clusters (mit lokaler Port-Weiterleitung) und legen Sie
10000
für Quellport und
für Ziel fest. Ersetzen Siemaster-public-dns-name
:10000
durch den öffentlichen DNS-Namen des Master-Knotens.master-public-dns-name
-
Fügen Sie SQL Workbench den JDBC-Treiber hinzu.
-
Klicken Sie im Dialogfeld Select Connection Profile (Verbindungsprofil auswählen) auf Manage Drivers (Treiber verwalten).
-
Klicken Sie auf das Symbol (leere Seite) Create a new entry (Neuen Eintrag erstellen).
-
Geben Sie in das Feld Name
Hive JDBC
ein. -
Klicken Sie bei Library (Bibliothek) auf das Symbol Select the JAR file(s) (JAR-Datei(en) auswählen).
-
Navigieren Sie zu dem Speicherort, der die extrahierten Treiber enthält. Wählen Sie die Treiber aus, die in der heruntergeladenen Version des JDBC-Treiberpakets enthalten sind, und klicken Sie auf Öffnen.
Ihr JDBC-Treiberpaket kann beispielsweise Folgendes enthalten. JARs
hive_metastore.jar hive_service.jar HiveJDBC41.jar libfb303-0.9.0.jar libthrift-0.9.0.jar log4j-1.2.14.jar ql.jar slf4j-api-1.5.11.jar slf4j-log4j12-1.5.11.jar TCLIServiceClient.jar zookeeper-3.4.6.jar
-
Wählen Sie im Dialogfeld Please select one driver (Einen Treiber auswählen) die Optionen
com.amazon.hive.jdbc41.HS2Driver
und OK (OK) aus.
-
-
Wenn Sie zum Dialogfeld Manage Drivers (Treiber verwalten) zurückkehren, überprüfen Sie, ob das Feld Classname (Klassenname) ausgefüllt ist. Klicken Sie dann auf OK (OK).
Wenn Sie zum Dialogfeld Select Connection Profile (Verbindungsprofil auswählen) zurückkehren, überprüfen Sie, ob das Dialogfeld Driver (Treiber) auf Hive JDBC (Hive JDBC) festgelegt ist. Geben Sie die folgende JDBC-Verbindungszeichenfolge im Feld URL (URL) ein:
jdbc:hive2://localhost:10000/default
.Wählen Sie OK (OK) aus, um die Verbindung herzustellen. Nachdem die Verbindung aufgebaut ist, werden oben im SQL Workbench/J-Fenster Verbindungsdetails angezeigt.
Weitere Informationen zur Verwendung von Hive und der JDBC-Schnittstelle finden Sie in der Apache Hive-Dokumentation unter HiveClient