Amazon EMR on EKS 6.11.0 リリース
このページでは、Amazon EMR on EKS デプロイに固有の Amazon EMR の新しい機能と更新された機能について説明します。Amazon EC2 で実行されている Amazon EMR の詳細と Amazon EMR 6.11.0 リリース全般の詳細については、「Amazon EMR リリースガイド」の「Amazon EMR 6.11.0」を参照してください。
Amazon EMR on EKS 6.11 リリース
Amazon EMR on EKS では、次の Amazon EMR 6.11.0 リリースが利用可能です。特定の emr-6.11.0-XXXX リリースを選択すると、関連するコンテナイメージタグなどの詳細が表示されます。
-
emr-6.11.0-spark-rapids-latest
-
emr-6.11.0-spark-rapids-20230509
-
emr-6.11.0-java11-latest
-
emr-6.11.0-java11-20230509
-
notebook-spark/emr-6.11.0-latest
-
notebook-spark/emr-6.11.0-20230509
-
notebook-python/emr-6.11.0-latest
-
notebook-python/emr-6.11.0-20230509
リリースノート
Amazon EMR on EKS 6.11.0 のリリースノート
-
サポートされているアプリケーション - AWS SDK for Java 1.12.446、Apache Spark 3.3.2-amzn-0、Apache Hudi 0.13.0-amzn-0、Apache Iceberg 1.2.0-amzn-0、Delta 2.2.0、Apache Spark RAPIDS 23.02.0-amzn-0、Jupyter Enterprise Gateway 2.6.0
-
サポートされているコンポーネント -
aws-sagemaker-spark-sdk
、emr-ddb
、emr-goodies
、emr-s3-select
、emrfs
、hadoop-client
、hudi
、hudi-spark
、iceberg
、spark-kubernetes
。 -
サポートされている設定分類
StartJobRun API と CreateManagedEndpoint API で使用する場合:
分類 説明 core-site
core-site.xml
Hadoop ファイル内の値を変更します。emrfs-site
EMRFS の設定を変更します。
spark-metrics
metrics.properties
Spark ファイル内の値を変更します。spark-defaults
spark-defaults.conf
Spark ファイル内の値を変更します。spark-env
Spark 環境の値を変更します。
spark-hive-site
hive-site.xml
Spark ファイル内の値を変更します。spark-log4j
log4j.properties
Spark ファイル内の値を変更します。特に CreateManagedEndpoint API で使用する場合:
分類 説明 jeg-config
Jupyter Enterprise Gateway
jupyter_enterprise_gateway_config.py
ファイルの値を変更します。jupyter-kernel-overrides
Jupyter カーネル仕様ファイル内のカーネルイメージの値を変更します。
設定分類を使用すると、アプリケーションをカスタマイズできます。これらは多くの場合、
spark-hive-site.xml
などのアプリケーションの構成 XML ファイルに対応します。詳細については、「アプリケーションの設定」を参照してください。
注目すべき機能
Amazon EMR on EKS の 6.11 リリースには、以下の機能が含まれています。
-
Amazon ECR Public Gallery 内の Amazon EMR on EKS ベースイメージ – カスタムイメージ機能を使用する場合は、ベースイメージに用意されている必須の jar、設定、ライブラリを利用して、Amazon EMR on EKS とやり取りできます。ベースイメージは、Amazon ECR Public Gallery
に収められるようになりました。 -
Spark コンテナログのローテーション – Amazon EMR on EKS 6.11 は、Spark コンテナログのローテーションをサポートしています。この機能を有効にするには、
StartJobRun
API のMonitoringConfiguration
オペレーション内でcontainerLogRotationConfiguration
を使用します。rotationSize
とmaxFilestoKeep
を設定すると、Amazon EMR on EKS の Spark ドライバーポッドとエグゼキュターポッドに保持されるログファイルの数とサイズを指定できます。詳細については、「Spark コンテナログのローテーションを使用する」を参照してください。 -
Spark オペレータと spark-submit での Volcano サポート – Amazon EMR on EKS 6.11 では、Spark オペレータと spark-submit で Volcano を Kubernetes カスタムスケジューラとして使用して、Spark ジョブを実行できます。ギャングスケジューリング、キュー管理、プリエンプション、フェアシェアスケジューリングなどの機能を使用すると、スケジューリングのスループットを高め、キャパシティを最適化できます。詳細については、「Amazon EMR on EKS で Apache Spark のカスタムスケジューラとして Volcano を使用する方法」を参照してください。