Den Hive-JDBC-Treiber verwenden

Sie können beliebte Business Intelligence-Tools wie Microsoft Excel, MicroStrategyQlikView, und Tableau mit Amazon EMR verwenden, um Ihre Daten zu untersuchen und zu visualisieren. Viele dieser Tools erfordern einen Java Database Connectivity (JDBC)- oder einen Open Database Connectivity (ODBC)-Treiber. Amazon EMR unterstützt sowohl JDBC- als auch ODBC-Konnektivität zu einem Spark-, Hive- oder Presto-Cluster.

Das folgende Beispiel zeigt die Verwendung von SQL Workbench/J als SQL-Client, um eine Verbindung zu einem Hive-Cluster in Amazon EMR herzustellen. Weitere Treiber finden Sie unter Verwenden von Business-Intelligence-Tools mit Amazon EMR.

Bevor Sie SQL Workbench/J installieren und damit arbeiten, laden Sie das Treiber-Paket herunter, und installieren Sie den Treiber. Die in dem Paket enthaltenen Treiber unterstützen die Hive-Versionen, die in den Amazon-EMR-Versionen 4.0 und höher verfügbar sind. Detaillierte Versionshinweise und Dokumentationen finden Sie in der PDF-Dokumentation in dem Paket.

Die neuesten JDBC- und ODBC-Treiberpakete

http://awssupportdatasvcs.com/bootstrap-actions/Simba/

So installieren und konfigurieren Sie die SQL Workbench

Laden Sie den Workbench/J SQL-Client für Ihr Betriebssystem von herunter. http://www.sql-workbench.net/downloads.html
Installieren Sie SQL Workbench/J. Weitere Informationen finden Sie unter SQL Workbench/J installieren und starten im SQL-Handbuch. Workbench/J
Linux-, Unix-, Mac OS X-Benutzer: Erstellen Sie mithilfe des folgenden Befehls in einer Terminalsitzung einen SSH-Tunnel zum Master-Knoten Ihres Clusters. master-public-dns-nameErsetzen Sie durch den öffentlichen DNS-Namen des Master-Knotens und durch den Speicherort und den Dateinamen Ihrer Amazon EC2 EC2-Datei path-to-key-file mit privatem Schlüssel (.pem).
```
ssh -o ServerAliveInterval=10 -i path-to-key-file -N -L 10000:localhost:10000 hadoop@master-public-dns-name
```
Windows-Benutzer: Erstellen Sie in einer PuTTY-Sitzung einen SSH-Tunnel zum Hauptknoten Ihres Clusters (mit lokaler Port-Weiterleitung) und legen Sie 10000 für Quellport und master-public-dns-name:10000 für Ziel fest. Ersetzen Sie master-public-dns-name durch den öffentlichen DNS-Namen des Master-Knotens.
Fügen Sie SQL Workbench den JDBC-Treiber hinzu.
1. Klicken Sie im Dialogfeld Select Connection Profile (Verbindungsprofil auswählen) auf Manage Drivers (Treiber verwalten).
2. Klicken Sie auf das Symbol (leere Seite) Create a new entry (Neuen Eintrag erstellen).
3. Geben Sie in das Feld Name Hive JDBC ein.
4. Klicken Sie bei Library (Bibliothek) auf das Symbol Select the JAR file(s) (JAR-Datei(en) auswählen).
5. Navigieren Sie zu dem Speicherort, der die extrahierten Treiber enthält. Wählen Sie die Treiber aus, die in der heruntergeladenen Version des JDBC-Treiberpakets enthalten sind, und klicken Sie auf Öffnen.
  
  Ihr JDBC-Treiberpaket kann beispielsweise Folgendes enthalten. JARs
```
hive_metastore.jar
hive_service.jar
HiveJDBC41.jar
libfb303-0.9.0.jar
libthrift-0.9.0.jar
log4j-1.2.14.jar
ql.jar
slf4j-api-1.5.11.jar
slf4j-log4j12-1.5.11.jar
TCLIServiceClient.jar
zookeeper-3.4.6.jar
```
6. Wählen Sie im Dialogfeld Please select one driver (Einen Treiber auswählen) die Optionen com.amazon.hive.jdbc41.HS2Driver und OK (OK) aus.
Wenn Sie zum Dialogfeld Manage Drivers (Treiber verwalten) zurückkehren, überprüfen Sie, ob das Feld Classname (Klassenname) ausgefüllt ist. Klicken Sie dann auf OK (OK).
Wenn Sie zum Dialogfeld Select Connection Profile (Verbindungsprofil auswählen) zurückkehren, überprüfen Sie, ob das Dialogfeld Driver (Treiber) auf Hive JDBC (Hive JDBC) festgelegt ist. Geben Sie die folgende JDBC-Verbindungszeichenfolge im Feld URL (URL) ein: jdbc:hive2://localhost:10000/default.
Wählen Sie OK (OK) aus, um die Verbindung herzustellen. Nachdem die Verbindung hergestellt wurde, werden die Verbindungsdetails oben im Workbench/J SQL-Fenster angezeigt.

Weitere Informationen zur Verwendung von Hive und der JDBC-Schnittstelle finden Sie JDBCInterface in der Apache HiveClient Hive-Dokumentation unter und Hive.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Verwenden einer externen MySQL-Datenbank oder von Amazon Aurora;

Verbessern der Hive-Leistung