Amazon EMR pada rilis EKS 7.2.0 - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Amazon EMR pada rilis EKS 7.2.0

Halaman ini menjelaskan fungsionalitas baru dan yang diperbarui untuk Amazon EMR yang khusus untuk EMR Amazon saat EKS penyebaran. Untuk detail tentang Amazon yang EMR berjalan di Amazon EC2 dan tentang rilis Amazon EMR 7.2.0 secara umum, lihat Amazon EMR 7.2.0 di Panduan EMR Rilis Amazon.

Amazon EMR pada rilis EKS 7.2

Rilis Amazon EMR 7.2.0 berikut tersedia untuk Amazon EMR diEKS. Pilih emr-7.2.0- XXXX rilis tertentu untuk melihat detail lebih lanjut seperti tag gambar kontainer terkait.

Flink releases

Rilis Amazon EMR 7.2.0 berikut tersedia untuk EMR Amazon EKS saat Anda menjalankan aplikasi Flink.

Spark releases

Rilis Amazon EMR 7.2.0 berikut tersedia untuk EMR Amazon EKS saat Anda menjalankan aplikasi Spark.

  • emr-7.2.0-terbaru

  • emr-7.2.0-20240610

  • emr-7.2.0-spark-rapids-latest

  • emr-7.2.0-spark-rapids-20240610

  • emr-7.2.0-java11-latest

  • emr-7.2.0-java11-20240610

  • emr-7.2.0-java8-latest

  • emr-7.2.0-java8-20240610

  • emr-7.2.0-spark-rapids-java8-latest

  • emr-7.2.0-spark-rapids-java8-20240610

  • notebook-spark/emr-7.2.0-latest

  • notebook-spark/emr-7.2.0-20240610

  • notebook-spark/emr-7.2.0-spark-rapids-latest

  • notebook-spark/emr-7.2.0-spark-rapids-20240610

  • notebook-spark/emr-7.2.0-java11-latest

  • notebook-spark/emr-7.2.0-java11-20240610

  • notebook-spark/emr-7.2.0-java8-latest

  • notebook-spark/emr-7.2.0-java8-20240610

  • notebook-spark/emr-7.2.0-spark-rapids-java8-latest

  • notebook-spark/emr-7.2.0-spark-rapids-java8-20240610

  • notebook-python/emr-7.2.0-latest

  • notebook-python/emr-7.2.0-20240610

  • notebook-python/emr-7.2.0-spark-rapids-latest

  • notebook-python/emr-7.2.0-spark-rapids-20240610

  • notebook-python/emr-7.2.0-java11-latest

  • notebook-python/emr-7.2.0-java11-20240610

  • notebook-python/emr-7.2.0-java8-latest

  • notebook-python/emr-7.2.0-java8-20240610

  • notebook-python/emr-7.2.0-spark-rapids-java8-latest

  • notebook-python/emr-7.2.0-spark-rapids-java8-20240610

  • livy/emr-7.2.0-latest

  • livy/emr-7.2.0-20240610

  • livy/emr-7.2.0-java11-latest

  • livy/emr-7.2.0-java11-20240610

  • livy/emr-7.2.0-java8-latest

  • livy/emr-7.2.0-java8-20240610

Catatan rilis

Catatan rilis untuk Amazon EMR di EKS 7.2.0

  • Aplikasi yang didukung - AWS SDK for Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1

  • Komponen yang didukung - aws-sagemaker-spark-sdkemr-ddb,emr-goodies,,emr-s3-select,emrfs,hadoop-client,hudi,hudi-spark,iceberg,spark-kubernetes.

  • Klasifikasi konfigurasi yang didukung

    Untuk digunakan dengan StartJobRundan CreateManagedEndpointAPIs:

    Klasifikasi Deskripsi

    core-site

    Ubah nilai dalam file core-site.xml Hadoop.

    emrfs-site

    Ubah EMRFS pengaturan.

    spark-metrics

    Ubah nilai dalam file metrics.properties Spark.

    spark-defaults

    Ubah nilai dalam file spark-defaults.conf Spark.

    spark-env

    Ubah nilai di lingkungan Spark.

    spark-hive-site

    Ubah nilai dalam file hive-site.xml Spark.

    spark-log4j2

    Ubah nilai dalam file log4j2.properties Spark.

    emr-job-submitter

    Konfigurasi untuk pod pengirim pekerjaan.

    Untuk digunakan secara khusus dengan CreateManagedEndpointAPIs:

    Klasifikasi Deskripsi

    jeg-config

    Ubah nilai dalam file Jupyter Enterprise Gatewayjupyter_enterprise_gateway_config.py.

    jupyter-kernel-overrides

    Ubah nilai untuk Gambar Kernel di file Spesifikasi Kernel Jupyter.

    Klasifikasi konfigurasi memungkinkan Anda menyesuaikan aplikasi. Ini sering sesuai dengan XML file konfigurasi untuk aplikasi, sepertispark-hive-site.xml. Untuk informasi selengkapnya, lihat Mengkonfigurasi Aplikasi.

Fitur penting

Fitur-fitur berikut disertakan dengan rilis 7.2.0 Amazon EMR diEKS.

  • Peningkatan aplikasi - Amazon EMR pada peningkatan aplikasi EKS 7.2.0 termasuk Spark 3.5.1, Flink 1.18.1, dan Flink Operator 1.8.0.

  • Autoscaler untuk pembaruan Flink - Rilis 7.2.0 menggunakan konfigurasi open source job.autoscaler.restart.time-tracking.enabled untuk mengaktifkan estimasi waktu penskalaan ulang, jadi Anda tidak perlu lagi menetapkan nilai empiris secara manual untuk memulai ulang waktu. Jika Anda menjalankan 7.1.0 atau lebih rendah, Anda masih dapat menggunakan penskalaan EMR otomatis Amazon.

  • Integrasi Apache Hudi Apache Flink di EMR Amazon EKS di - Rilis ini menambahkan integrasi antara Apache Hudi dan Apache Flink, sehingga Anda dapat menggunakan operator Flink Kubernetes untuk menjalankan pekerjaan Hudi. Hudi memungkinkan Anda menggunakan operasi tingkat rekaman yang dapat Anda gunakan untuk menyederhanakan manajemen data dan pengembangan pipa data.

  • Integrasi Amazon S3 Express One Zone dengan EMR Amazon aktif EKS - Dengan 7.2.0 dan yang lebih tinggi, Anda dapat mengunggah data ke S3 Express One Zone dengan Amazon aktif. EMR EKS S3 Express One Zone adalah kelas penyimpanan Amazon S3 zona tunggal berkinerja tinggi yang memberikan akses data milidetik satu digit yang konsisten untuk sebagian besar aplikasi yang sensitif terhadap latensi. Pada saat rilis, S3 Express One Zone memberikan latensi terendah dan penyimpanan objek cloud kinerja tertinggi di Amazon S3.

  • Support untuk konfigurasi default di operator Spark - Operator Spark di Amazon EKS sekarang mendukung konfigurasi default yang sama dengan model start job run EMR di Amazon EKS untuk 7.2.0 dan yang lebih tinggi. Ini berarti bahwa fitur seperti Amazon S3 dan EMRFS tidak lagi memerlukan konfigurasi manual dalam file yaml.