Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Gunakan cluster Delta Lake dengan Trino
Dengan Amazon EMR rilis 6.9.0 dan lebih tinggi, Anda dapat menggunakan Delta Lake dengan cluster Trino Anda.
Dalam tutorial ini, kita akan menggunakan AWS CLI untuk bekerja dengan Delta Lake di Amazon EMR Trino cluster.
Buat cluster Delta Lake
-
Buat file,
delta_configurations.json
, dan tetapkan nilai untuk katalog yang Anda pilih. Misalnya, jika Anda ingin menggunakan metastore Hive sebagai katalog, file Anda harus memiliki konten berikut:[{"Classification":"delta-defaults", "Properties":{"delta.enabled":"true"}}, {"Classification":"trino-connector-delta", "Properties":{"hive.metastore.uri":"thrift://localhost:9083"}}]
Jika Anda ingin menggunakan AWS Glue Catalog sebagai toko Anda, file Anda harus memiliki konten berikut:
[{"Classification":"delta-defaults", "Properties":{"delta.enabled":"true"}}, {"Classification":"trino-connector-delta", "Properties":{"hive.metastore":"glue"}}]
-
Buat cluster dengan konfigurasi berikut, ganti
example Amazon S3 bucket path
dansubnet ID
dengan milik Anda sendiri.aws emr create-cluster --release-label emr-6.9.0 --applications Name=Trino --configurations file://delta_configurations.json --region us-east-1 --name My_Spark_Delta_Cluster --log-uri
s3://amzn-s3-demo-bucket/
--instance-type m5.xlarge --instance-count 2 --service-role EMR_DefaultRole_V2 --ec2-attributes InstanceProfile=EMR_EC2_DefaultRole,SubnetId=subnet-1234567890abcdef0
Inisialisasi sesi Trino untuk Delta Lake
Untuk menginisialisasi sesi Trino, jalankan perintah berikut
trino-cli --catalog delta
Menulis ke meja Delta Lake
Buat dan tulis ke tabel Anda dengan perintah SQL berikut:
SHOW SCHEMAS;
CREATE TABLE default.delta_table (id int, data varchar, category varchar) WITH
( location = 's3://amzn-s3-demo-bucket/<prefix>'
);
INSERT INTO default.delta_table VALUES (1,'a','c1'), (2,'b','c2'), (3,'c','c3');
Baca dari meja Delta Lake
Baca dari tabel Anda dengan perintah SQL berikut:
SELECT * from default.delta_table;