使用 Presto 创建数据来源 - Amazon QuickSight

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Presto 创建数据来源

Presto(或 PrestoDB)是一个开源的SQL分布式查询引擎,专为对任何规模的数据进行快速分析查询而设计。它同时支持非关系数据源和关系数据源。支持的非关系数据源包括 Hadoop 分布式文件系统 (HDFS)、Amazon S3、Cassandra、MongoDB 和。HBase支持的关系数据源包括 My SQL、Postgre SQL、Amazon Redshift、微SQL软服务器和 Teradata。

有关 Presto 的更多信息,请参阅以下内容:

  • presto 简介,网站上对 Presto 的描述。 AWS

  • 在《亚马逊EMR发布指南》中使用亚马逊弹性 MapReduce (EMR) 创建 presto 集群

  • 有关 Presto 的一般信息,请参阅 Presto 文档

您通过 Presto 查询引擎运行的查询结果可以转换为 Amazon QuickSight 数据集。Presto 在后端数据库中处理分析查询。然后,它会将结果返回给 Amazon QuickSight 客户端。您可以通过 Presto 直接查询数据,也可以将查询结果导入 SPICE.

在使用 Amazon QuickSight 作为 Presto 客户端运行查询之前,请务必配置数据源配置文件。您需要在 Amazon 中 QuickSight 为要访问的每个 Presto 数据源提供数据源配置文件。可以按照以下过程创建到 VPC 的连接。

从亚马逊 QuickSight (控制台)创建与 presto 数据源的新连接
  1. 在 Amazon QuickSight 起始页上,选择右上角的数据集。然后选择新数据集

  2. 选择 Presto 磁贴。

    注意

    在大多数浏览器中,您可以使用 Ctrl-F 或 Cmd-F 打开搜索框,然后输入 presto 进行查找。

  3. 添加新数据源的设置:

    • 数据来源名称 – 为您的数据来源输入描述性名称。此名称显示在数据集屏幕底部的现有数据来源部分中。

    • 连接类型 – 选择连接到 Presto 时需要使用的连接类型。

      要通过公有网络进行连接,请选择公有网络

      如果您使用公共网络,则必须使用轻型目录访问协议 (LDAP) 保护您的 Presto 服务器并对其进行身份验证。有关配置 Presto 以供使用的信息LDAP,请参阅 Presto 文档中的LDAP身份验证

      要通过虚拟专用连接进行连接,请从VPC连接列表中选择相应的VPC名称。

      如果您的 Presto 服务器允许未经身份验证的访问,则 AWS 要求您使用私VPC有连接安全地连接到该服务器。有关配置新服务器的信息VPC,请参阅通过 Amaz VPC on 连接到 QuickSight

    • 数据库服务器 – 数据库服务器的名称。

    • 端口-服务器用于接受来自 Amazon 的传入连接的端口 QuickSight

    • 目录 – 要使用的目录的名称。

    • 需要身份验证-(可选)此选项仅在您选择VPC连接类型时出现。如果您要连接的 Presto 数据来源不需要身份验证,请选择。否则,请保留默认设置()。

    • 用户名 – 输入用于连接到 Presto 的用户名。Amazon 将相同的用户名和密码 QuickSight 应用于使用此数据源配置文件的所有连接。如果您想将亚马逊与其他账户 QuickSight 分开监控,请为每个亚马逊 QuickSight 数据源配置文件创建一个 Presto 账户。

      您使用的 Presto 账户必须能够访问数据库,并至少能够在一个表上运行 SELECT 语句。

    • 密码 – 要与 Presto 用户名一起使用的密码。Amazon QuickSight 会加密您在数据源配置文件中使用的所有凭证。有关更多信息,请参阅 Amazon 中的数据加密 QuickSight

    • 启用 SSL-默认情况下SSL处于启用状态。

  4. 选择验证连接以测试设置。

  5. 验证您的设置后,选择创建数据源以完成连接。