Amazon EMR pada rilis EKS 6.10.0 - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Amazon EMR pada rilis EKS 6.10.0

Rilis Amazon EMR 6.10.0 berikut tersedia untuk Amazon EMR di. EKS Pilih emr-6.10.0- XXXX rilis tertentu untuk melihat detail lebih lanjut seperti tag gambar kontainer terkait.

Catatan rilis untuk Amazon EMR 6.10.0

  • Aplikasi yang didukung - AWS SDK for Java 1.12.397, Spark 3.3.1-amzn-0, Hudi 0.12.2-amzn-0, Iceberg 1.1.0-amzn-0, Delta 2.2.0.

  • Komponen yang didukung - aws-sagemaker-spark-sdkemr-ddb,emr-goodies,,emr-s3-select,emrfs,hadoop-client,hudi,hudi-spark,iceberg,spark-kubernetes.

  • Klasifikasi konfigurasi yang didukung:

    Untuk digunakan dengan StartJobRundan CreateManagedEndpointAPIs:

    Klasifikasi Deskripsi

    core-site

    Ubah nilai dalam file Hadoop. core-site.xml

    emrfs-site

    Ubah EMRFS pengaturan.

    spark-metrics

    Ubah nilai dalam metrics.properties file Spark.

    spark-defaults

    Ubah nilai dalam spark-defaults.conf file Spark.

    spark-env

    Ubah nilai di lingkungan Spark.

    spark-hive-site

    Ubah nilai dalam hive-site.xml file Spark.

    spark-log4j

    Ubah nilai dalam log4j.properties file Spark.

    Untuk digunakan secara khusus dengan CreateManagedEndpointAPIs:

    Klasifikasi Deskripsi

    jeg-config

    Ubah nilai dalam file Jupyter Enterprise Gatewayjupyter_enterprise_gateway_config.py.

    jupyter-kernel-overrides

    Ubah nilai untuk Gambar Kernel di file Spesifikasi Kernel Jupyter.

    Klasifikasi konfigurasi memungkinkan Anda menyesuaikan aplikasi. Ini sering sesuai dengan XML file konfigurasi untuk aplikasi, sepertispark-hive-site.xml. Untuk informasi selengkapnya, lihat Mengkonfigurasi Aplikasi.

Fitur penting

  • Operator Spark - Dengan Amazon EMR di EKS 6.10.0 dan yang lebih tinggi, Anda dapat menggunakan operator Kubernetes untuk Apache Spark, atau operator Spark, untuk menyebarkan dan mengelola aplikasi Spark dengan runtime rilis Amazon di cluster Amazon Anda sendiri. EMR EKS Untuk informasi selengkapnya, lihat Menjalankan pekerjaan Spark dengan operator Spark.

  • Java 11 - Dengan Amazon EMR di EKS 6.10 dan lebih tinggi, Anda dapat meluncurkan Spark dengan runtime Java 11. Untuk melakukan ini, berikan emr-6.10.0-java11-latest sebagai label rilis. Sebaiknya Anda memvalidasi dan menjalankan pengujian kinerja sebelum memindahkan beban kerja produksi dari gambar Java 8 ke gambar Java 11.

  • Untuk integrasi Amazon Redshift untuk Apache Spark, EMR Amazon EKS di 6.10.0 menghapus dependensiminimal-json.jar, dan secara otomatis menambahkan jar terkait yang spark-redshift diperlukan ke jalur kelas pelaksana untuk Spark:,, dan. spark-redshift.jar spark-avro.jar RedshiftJDBC.jar

Perubahan

  • EMRFSKomitter yang dioptimalkan S3 sekarang diaktifkan secara default untuk parket,ORC, dan format berbasis teks (termasuk dan). CSV JSON