Redshift マネージドストレージ (RMS) と Iceberg および AWS Glue データカタログカタログ統合の使用 Iceberg RESTAPIと Glue データカタログでの Redshift マネージドストレージ (RMS) AWS の使用

EMR Serverless AWS での Glue マルチカタログ階層の使用

AWS Glue マルチカタログ階層で動作するようにEMRサーバーレスアプリケーションを設定できます。次の例は、 Glue マルチカタログ階層で EMR-S Spark AWS を使用する方法を示しています。

マルチカタログ階層の詳細については、「Amazon の Spark で AWS Glue Data Catalog でマルチカタログ階層を使用するEMR」を参照してください。

Iceberg と Glue データカタログでの Redshift マネージドストレージ (RMS) AWS の使用

以下は、Iceberg と Glue データカタログを統合するように Spark AWS を設定する方法を示しています。


aws emr-serverless start-job-run \
    --application-id application-id \
    --execution-role-arn job-role-arn \
    --job-driver '{
        "sparkSubmit": {
            "entryPoint": "s3://amzn-s3-demo-bucket/myscript.py",
            "sparkSubmitParameters": "--conf spark.sql.catalog.nfgac_rms = org.apache.iceberg.spark.SparkCatalog
             --conf spark.sql.catalog.rms.type=glue 
             --conf spark.sql.catalog.rms.glue.id=Glue RMS catalog ID 
             --conf spark.sql.defaultCatalog=rms
             --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions"
        }
    }'

統合後のカタログ内のテーブルからのサンプルクエリ：


SELECT * FROM my_rms_schema.my_table

Iceberg RESTAPIと Glue データカタログでの Redshift マネージドストレージ (RMS) AWS の使用

以下は、Iceberg RESTカタログで動作するように Spark を設定する方法を示しています。


aws emr-serverless start-job-run \
--application-id application-id \
--execution-role-arn job-role-arn \
--job-driver '{
"sparkSubmit": {
"entryPoint": "s3://amzn-s3-demo-bucket/myscript.py",
    "sparkSubmitParameters": "
    --conf spark.sql.catalog.rms=org.apache.iceberg.spark.SparkCatalog
    --conf spark.sql.catalog.rms.type=rest
    --conf spark.sql.catalog.rms.warehouse=Glue RMS catalog ID
    --conf spark.sql.catalog.rms.uri=Glue endpoint URI/iceberg
    --conf spark.sql.catalog.rms.rest.sigv4-enabled=true
    --conf spark.sql.catalog.rms.rest.signing-name=glue
    --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions"
    }
  }'

カタログ内のテーブルからのサンプルクエリ：


SELECT * FROM my_rms_schema.my_table

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

外部の Hive メタストアの使用

外部メタストアを使用する場合の考慮事項