搭配 Iceberg 和 Glue Data Catalog 目錄整合使用 Redshift 受管儲存 AWS (RMS)搭配 Iceberg RESTAPI和 Glue Data Catalog AWS 使用 Redshift 受管儲存 (RMS)

在 EMR Serverless 上使用 AWS Glue 多目錄階層

您可以設定無EMR伺服器應用程式以使用 AWS Glue 多目錄階層。下列範例示範如何搭配 Glue AWS 多目錄階層使用 -EMRS Spark。

若要進一步了解多目錄階層，請參閱使用 AWS Glue Data Catalog with Spark on Amazon 中的多目錄階層EMR。

搭配 Iceberg 和 Glue Data Catalog AWS 使用 Redshift 受管儲存 (RMS)

以下說明如何設定 Spark 以與 Iceberg AWS 的 Glue Data Catalog 整合：


aws emr-serverless start-job-run \
    --application-id application-id \
    --execution-role-arn job-role-arn \
    --job-driver '{
        "sparkSubmit": {
            "entryPoint": "s3://amzn-s3-demo-bucket/myscript.py",
            "sparkSubmitParameters": "--conf spark.sql.catalog.nfgac_rms = org.apache.iceberg.spark.SparkCatalog
             --conf spark.sql.catalog.rms.type=glue 
             --conf spark.sql.catalog.rms.glue.id=Glue RMS catalog ID 
             --conf spark.sql.defaultCatalog=rms
             --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions"
        }
    }'

整合後，來自目錄中資料表的範例查詢：


SELECT * FROM my_rms_schema.my_table

搭配 Iceberg RESTAPI和 Glue Data Catalog AWS 使用 Redshift 受管儲存 (RMS)

以下說明如何設定 Spark 以使用 Iceberg REST目錄：


aws emr-serverless start-job-run \
--application-id application-id \
--execution-role-arn job-role-arn \
--job-driver '{
"sparkSubmit": {
"entryPoint": "s3://amzn-s3-demo-bucket/myscript.py",
    "sparkSubmitParameters": "
    --conf spark.sql.catalog.rms=org.apache.iceberg.spark.SparkCatalog
    --conf spark.sql.catalog.rms.type=rest
    --conf spark.sql.catalog.rms.warehouse=Glue RMS catalog ID
    --conf spark.sql.catalog.rms.uri=Glue endpoint URI/iceberg
    --conf spark.sql.catalog.rms.rest.sigv4-enabled=true
    --conf spark.sql.catalog.rms.rest.signing-name=glue
    --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions"
    }
  }'

目錄中資料表的範例查詢：


SELECT * FROM my_rms_schema.my_table

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

使用外部 Hive 中繼存放區

使用外部中繼存放區時的考量事項