Bekerja dengan hirarki multi-katalog AWS Glue di Tanpa Server EMR - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Bekerja dengan hirarki multi-katalog AWS Glue di Tanpa Server EMR

Anda dapat mengonfigurasi aplikasi EMR Tanpa Server Anda untuk bekerja dengan hierarki multi-katalog AWS Glue. Contoh berikut menunjukkan cara menggunakan EMR -S Spark dengan hirarki multi-katalog AWS Glue.

Untuk mempelajari lebih lanjut tentang hierarki multi-katalog, lihat Bekerja dengan hierarki multi-katalog di Katalog Data AWS Glue dengan Spark di Amazon. EMR

Menggunakan Redshift Managed Storage (RMS) dengan Iceberg dan AWS Glue Data Catalog

Berikut ini menunjukkan cara mengkonfigurasi Spark untuk integrasi dengan AWS Glue Data Catalog dengan Iceberg:

aws emr-serverless start-job-run \ --application-id application-id \ --execution-role-arn job-role-arn \ --job-driver '{ "sparkSubmit": { "entryPoint": "s3://amzn-s3-demo-bucket/myscript.py", "sparkSubmitParameters": "--conf spark.sql.catalog.nfgac_rms = org.apache.iceberg.spark.SparkCatalog --conf spark.sql.catalog.rms.type=glue --conf spark.sql.catalog.rms.glue.id=Glue RMS catalog ID --conf spark.sql.defaultCatalog=rms --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions" } }'

Contoh kueri dari tabel dalam katalog, berikut integrasi:

SELECT * FROM my_rms_schema.my_table

Menggunakan Redshift Managed Storage (RMS) dengan Iceberg REST API dan AWS Glue Data Catalog

Berikut ini menunjukkan cara mengkonfigurasi Spark untuk bekerja dengan katalog IcebergREST:

aws emr-serverless start-job-run \ --application-id application-id \ --execution-role-arn job-role-arn \ --job-driver '{ "sparkSubmit": { "entryPoint": "s3://amzn-s3-demo-bucket/myscript.py", "sparkSubmitParameters": " --conf spark.sql.catalog.rms=org.apache.iceberg.spark.SparkCatalog --conf spark.sql.catalog.rms.type=rest --conf spark.sql.catalog.rms.warehouse=Glue RMS catalog ID --conf spark.sql.catalog.rms.uri=Glue endpoint URI/iceberg --conf spark.sql.catalog.rms.rest.sigv4-enabled=true --conf spark.sql.catalog.rms.rest.signing-name=glue --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions" } }'

Contoh kueri dari tabel di katalog:

SELECT * FROM my_rms_schema.my_table