Durchsuchen Sie Daten mit dem Explorer SQL - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Durchsuchen Sie Daten mit dem Explorer SQL

Anmerkung

SQLExplorer for EMR Studio wird mit interaktiven Amazon EMR Serverless-Anwendungen oder in einem Studio, in dem IAM Identity Center vertrauenswürdige Identitätsverbreitung aktiviert ist, nicht unterstützt.

Dieses Thema enthält Informationen, die Ihnen bei den ersten Schritten mit SQL Explorer in Amazon EMR Studio helfen sollen. SQLExplorer ist ein einseitiges Tool in Ihrem Workspace, das Ihnen hilft, die Datenquellen im Datenkatalog Ihres EMR Clusters zu verstehen. Sie können den SQL Explorer verwenden, um Ihre Daten zu durchsuchen, SQL Abfragen zum Abrufen von Daten auszuführen und Abfrageergebnisse herunterzuladen.

SQLDer Explorer unterstützt Presto. Bevor Sie SQL Explorer verwenden, stellen Sie sicher, dass Sie über einen Cluster verfügen, der Amazon EMR Version 5.34.0 oder höher oder Version 6.4.0 oder höher verwendet und Presto installiert hat. Der Amazon EMR Studio SQL Explorer unterstützt keine Presto-Cluster, die Sie mit Verschlüsselung bei der Übertragung konfiguriert haben. Das liegt daran, dass Presto auf diesen Clustern im TLS Modus läuft.

Durchsuchen Sie den Datenkatalog Ihres Clusters

SQLExplorer bietet eine Katalogbrowser-Oberfläche, mit der Sie untersuchen und verstehen können, wie Ihre Daten organisiert sind. Sie können beispielsweise den Datenkatalog-Browser verwenden, um Tabellen- und Spaltennamen zu überprüfen, bevor Sie eine SQL Abfrage schreiben.

Wie Sie Ihren Datenkatalog durchsuchen
  1. Öffnen Sie den SQL Explorer in Ihrem Workspace.

  2. Stellen Sie sicher, dass Ihr Workspace mit einem EMR Cluster verbunden istEC2, auf dem Amazon EMR Version 6.4.0 oder höher mit installiertem Presto ausgeführt wird. Sie können einen vorhandenen Cluster auswählen oder einen neuen erstellen. Weitere Informationen finden Sie unter Hängen Sie einen Computer an einen EMR Studio-Workspace an.

  3. Wählen Sie eine Datenbank aus der Drop-down-Liste aus, um sie zu durchsuchen.

  4. Erweitern Sie eine Tabelle in Ihrer Datenbank, um die Spaltennamen der Tabelle zu sehen. Sie können in der Suchleiste auch ein Schlüsselwort eingeben, um die Tabellenergebnisse zu filtern.

Führen Sie eine SQL Abfrage aus, um Daten abzurufen

Um Daten mit einer SQL Abfrage abzurufen und die Ergebnisse herunterzuladen
  1. Öffnen Sie den SQL Explorer in Ihrem Workspace.

  2. Stellen Sie sicher, dass Ihr Workspace EC2 mit einem EMR Cluster verbunden ist, auf dem Presto und Spark installiert sind. Sie können einen vorhandenen Cluster auswählen oder einen neuen erstellen. Weitere Informationen finden Sie unter Hängen Sie einen Computer an einen EMR Studio-Workspace an.

  3. Wählen Sie Editor öffnen, um eine neue Editor-Registerkarte in Ihrem Workspace zu öffnen.

  4. Verfassen Sie Ihre SQL Abfrage auf der Registerkarte „Editor“.

  5. Wählen Sie Ausführen aus.

  6. Sehen Sie sich Ihre Abfrageergebnisse unter Ergebnisvorschau an. SQLDer Explorer zeigt standardmäßig die ersten 100 Ergebnisse an. Sie können eine andere Anzahl von Ergebnissen für die Anzeige auswählen (bis zu 1 000), indem Sie das Dropdownmenü Vorschau der ersten 100 Abfrageergebnisse verwenden.

  7. Wählen Sie Ergebnisse herunterladen, um Ihre Ergebnisse im CSV Format herunterzuladen. Sie können bis zu 1 000 Ergebniszeilen herunterladen.