選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

將 Delta Lake 叢集與 Trino 搭配使用 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將 Delta Lake 叢集與 Trino 搭配使用

使用 Amazon EMR 6.9.0 版及更高版本,您可以將 Delta Lake 與 Trino 叢集搭配使用。

在本教學課程中,我們將使用 AWS CLI 在 Amazon EMR Trino 叢集上使用 Delta Lake。

建立 Delta Lake 叢集
  1. 建立檔案 delta_configurations.json,並為您選擇的型錄設定值。例如,如果您想要使用 Hive 中繼存放區作為型錄,您的檔案應具有下列內容:

    [{"Classification":"delta-defaults", "Properties":{"delta.enabled":"true"}}, {"Classification":"trino-connector-delta", "Properties":{"hive.metastore.uri":"thrift://localhost:9083"}}]

    如果您想要使用 AWS Glue Catalog 做為您的存放區,您的檔案應具有下列內容:

    [{"Classification":"delta-defaults", "Properties":{"delta.enabled":"true"}}, {"Classification":"trino-connector-delta", "Properties":{"hive.metastore":"glue"}}]
  2. 使用下列組態建立叢集,並將 example Amazon S3 bucket pathsubnet ID 取代為您自己的值。

    aws emr create-cluster --release-label emr-6.9.0 --applications Name=Trino --configurations file://delta_configurations.json --region us-east-1 --name My_Spark_Delta_Cluster --log-uri s3://amzn-s3-demo-bucket/ --instance-type m5.xlarge --instance-count 2 --service-role EMR_DefaultRole_V2 --ec2-attributes InstanceProfile=EMR_EC2_DefaultRole,SubnetId=subnet-1234567890abcdef0

初始化 Delta Lake 的 Trino 工作階段

若要初始化 Trino 工作階段,請執行下列命令

trino-cli --catalog delta

寫入至 Delta Lake 資料表

使用下列 SQL 命令建立並寫入至資料表:

SHOW SCHEMAS; CREATE TABLE default.delta_table (id int, data varchar, category varchar) WITH ( location = 's3://amzn-s3-demo-bucket/<prefix>'); INSERT INTO default.delta_table VALUES (1,'a','c1'), (2,'b','c2'), (3,'c','c3');

從 Delta Lake 資料表中讀取

使用下列 SQL 命令從資料表中讀取:

SELECT * from default.delta_table;
隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。