Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

Gunakan cluster Delta Lake dengan Trino - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gunakan cluster Delta Lake dengan Trino

Dengan Amazon EMR rilis 6.9.0 dan lebih tinggi, Anda dapat menggunakan Delta Lake dengan cluster Trino Anda.

Dalam tutorial ini, kita akan menggunakan AWS CLI untuk bekerja dengan Delta Lake di Amazon EMR Trino cluster.

Buat cluster Delta Lake
  1. Buat file,delta_configurations.json, dan tetapkan nilai untuk katalog yang Anda pilih. Misalnya, jika Anda ingin menggunakan metastore Hive sebagai katalog, file Anda harus memiliki konten berikut:

    [{"Classification":"delta-defaults", "Properties":{"delta.enabled":"true"}}, {"Classification":"trino-connector-delta", "Properties":{"hive.metastore.uri":"thrift://localhost:9083"}}]

    Jika Anda ingin menggunakan AWS Glue Catalog sebagai toko Anda, file Anda harus memiliki konten berikut:

    [{"Classification":"delta-defaults", "Properties":{"delta.enabled":"true"}}, {"Classification":"trino-connector-delta", "Properties":{"hive.metastore":"glue"}}]
  2. Buat cluster dengan konfigurasi berikut, ganti example Amazon S3 bucket path dan subnet ID dengan milik Anda sendiri.

    aws emr create-cluster --release-label emr-6.9.0 --applications Name=Trino --configurations file://delta_configurations.json --region us-east-1 --name My_Spark_Delta_Cluster --log-uri s3://amzn-s3-demo-bucket/ --instance-type m5.xlarge --instance-count 2 --service-role EMR_DefaultRole_V2 --ec2-attributes InstanceProfile=EMR_EC2_DefaultRole,SubnetId=subnet-1234567890abcdef0

Inisialisasi sesi Trino untuk Delta Lake

Untuk menginisialisasi sesi Trino, jalankan perintah berikut

trino-cli --catalog delta

Menulis ke meja Delta Lake

Buat dan tulis ke tabel Anda dengan perintah SQL berikut:

SHOW SCHEMAS; CREATE TABLE default.delta_table (id int, data varchar, category varchar) WITH ( location = 's3://amzn-s3-demo-bucket/<prefix>'); INSERT INTO default.delta_table VALUES (1,'a','c1'), (2,'b','c2'), (3,'c','c3');

Baca dari meja Delta Lake

Baca dari tabel Anda dengan perintah SQL berikut:

SELECT * from default.delta_table;
PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.