本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Trino 是一款开源查询引擎,专为对各种数据源进行交互式查询而设计。这些数据可能包括关系数据库、基于文件的数据、HDFS 数据等。带有 Amazon EMR 的 Trino 最常见的目的是对存储在 Amazon S3 中的大型数据集运行复杂的 SQL 查询。它还符合 ANSI SQL,这使得熟悉 SQL 的数据库工程师、数据分析师和数据科学家都很熟悉。
注意
2020 年 12 月,PrestoSQL 更名为 Trino。亚马逊 EMR 6.4.0 及更高版本通常指的是 Trino
重要
Trino 的早期版本 PrestoSQL 仍可用于亚马逊 EMR。但是,我们强烈建议 Trino 继续与 Amazon EMR 配合使用。另请注意,Trino 和 PrestoSQL 不能在同一个集群上同时运行。
下表列出了最新版本的亚马逊 EMR 7.x 中包含的 Trino 版本,以及亚马逊 EMR 与 Trino 一起安装的组件。有关此版本中与 Trino 一起安装的组件的版本,请参阅 7.8.0 版本的组件版本。
Amazon EMR 发行版标签 | Trino 版本 | 与 Trino 一起安装的组件 |
---|---|---|
emr-7.8.0 |
Trino 467 |
emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hudi, hudi-trino, hcatalog-server, mariadb-server, trino-coordinator, trino-worker |