使用SQL资源管理器浏览数据 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用SQL资源管理器浏览数据

注意

SQLAmazon EMR Serverless 交互式应用程序或启用了IAM身份中心可信身份传播的 Studio 不支持 Explorer for Studio。EMR

本主题提供的信息可帮助您开始在 Amazon EMR Studio 中使用 SQL Explorer。SQLExplorer 是 Workspace 中的单页工具,可帮助您了解EMR集群数据目录中的数据源。您可以使用 SQL Explorer 浏览数据、运行SQL查询以检索数据以及下载查询结果。

SQL资源管理器支持 Presto。在使用 SQL Explorer 之前,请确保您的集群使用安装了 Presto EMR 的 Amazon 版本 5.34.0 或更高版本或 6.4.0 或更高版本。Amazon EMR Studio SQL Explorer 不支持您配置了传输中加密的 Presto 集群。这是因为 Presto 在这些集群上以TLS模式运行。

浏览集群的数据目录

SQLExplorer 提供了一个目录浏览器界面,您可以使用该界面来浏览和了解数据的组织方式。例如,在编写SQL查询之前,您可以使用数据目录浏览器来验证表名和列名。

浏览数据目录
  1. 在工作区中打开SQL资源管理器。

  2. 请确保您的工作区已连接到运行于安装了 Presto EC2 的 Amazon 6.4.0 或更高EMR版本的EMR集群。您可以选择一个现有的集群或创建一个新的集群。有关更多信息,请参阅 将计算机连接到 EMR Studio 工作空间

  3. 请从下拉列表中选择一个要浏览的 Database(数据库)。

  4. 展开数据库中的表以查看表的列名称。您还可在搜索栏中输入一个关键词以筛选表结果。

运行SQL查询以检索数据

通过SQL查询检索数据并下载结果
  1. 在工作区中打开SQL资源管理器。

  2. 确保你的工作区已连接到安装了 Presto 和 Spark 的EMR集群。EC2您可以选择一个现有的集群或创建一个新的集群。有关更多信息,请参阅 将计算机连接到 EMR Studio 工作空间

  3. 选择 Open editor(打开编辑器)以在您的 Workspace 中打开一个新的编辑器选项卡。

  4. 在编辑器选项卡中撰写您的SQL查询。

  5. 选择运行

  6. Result preview(结果预览)下查看查询结果。SQL默认情况下,资源管理器显示前 100 个结果。您可以使用 Preview first 100 query results(预览前 100 个查询结果)下拉列表以选择要求显示的不同数量的结果(最高 1000)。

  7. 选择 “下载结果”,按CSV格式下载结果。您最多可以下载 1000 行结果。