SQL Explorer for EMR Studio でデータをブラウズする
注記
EMR Studio の SQL Explorer は、Amazon EMR Serverless 対話型アプリケーション、または IAM Identity Center の信頼できる ID 伝達が有効になっている Studio ではサポートされていません。
このトピックでは、Amazon EMR Studio で SQL Explorer の使用を開始する際に役立つ情報を紹介します。SQL Explorer は Workspace の単一ページのツールで、EMR クラスターのデータカタログのデータソースについて理解するのに役立ちます。SQL Explorer を使用してデータを参照したり、SQL クエリを実行してデータを取得したり、クエリ結果をダウンロードしたりできます。
SQL Explorer は Presto をサポートしています。SQL Explorer を使用する前に、Amazon EMR バージョン 5.34.0 以降またはバージョン 6.4.0 以降を使用するクラスターに Presto がインストールされていることを確認してください。Amazon EMR Studio SQL Explorer は、転送時の暗号化を設定している Presto クラスターをサポートしていません。これは、これらのクラスターでは Presto が TLS モードで実行されるためです。
クラスターのデータカタログを参照する
SQL Explorer にはカタログブラウザインターフェイスが用意されており、これを使用してデータがどのように構成されているかを調べて理解することができます。例えば、SQL クエリを記述する前に、データカタログブラウザを使用してテーブル名や列名を確認できます。
データカタログを参照するには
-
Workspace で SQL Explorer を開きます。
-
Workspace が、Amazon EMR バージョン 6.4.0 以降を使用し、Presto がインストール済みの EC2 で実行されている EMR クラスターにアタッチされていることを確認します。新しいクラスターを作成することも、既存のクラスターを選択することもできます。詳細については、「EMR Studio Workspace にコンピューティングをアタッチする」を参照してください。
-
ドロップダウンリストから [データベース] を選択して参照します。
-
データベースのテーブルを展開すると、そのテーブルの列名が表示されます。また、検索バーにキーワードを入力して、テーブルの結果をフィルタリングすることもできます。
SQL クエリを実行してデータを取得する
SQL クエリを使用してデータを取得し、結果をダウンロードするには
-
Workspace で SQL Explorer を開きます。
-
Workspace が、Presto と Spark がインストール済みの EC2 で実行されている EMR クラスターにアタッチされていることを確認します。新しいクラスターを作成することも、既存のクラスターを選択することもできます。詳細については、「EMR Studio Workspace にコンピューティングをアタッチする」を参照してください。
-
[エディタを開く] を選択して、Workspace で新しいエディタタブを開きます。
-
エディタタブで SQL クエリを作成します。
-
[Run] (実行) を選択します。
-
[結果のプレビュー] でクエリの結果を表示します。SQL Explorer は、デフォルトで最初の 100 件の結果を表示します。[最初の 100 件のクエリ結果をプレビュー] ドロップダウンを使用すると、表示する結果の数を選択して変更できます (最大 1000 件)。
-
結果を CSV 形式でダウンロードするには、[結果をダウンロード] を選択します。最大 1000 行の結果をダウンロードできます。