Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon EMR pada rilis EKS 7.2.0
Halaman ini menjelaskan fungsionalitas baru dan yang diperbarui untuk Amazon EMR yang khusus untuk EMR Amazon saat EKS penyebaran. Untuk detail tentang Amazon yang EMR berjalan di Amazon EC2 dan tentang rilis Amazon EMR 7.2.0 secara umum, lihat Amazon EMR 7.2.0 di Panduan EMR Rilis Amazon.
Amazon EMR pada rilis EKS 7.2
Rilis Amazon EMR 7.2.0 berikut tersedia untuk Amazon EMR diEKS. Pilih emr-7.2.0- XXXX rilis tertentu untuk melihat detail lebih lanjut seperti tag gambar kontainer terkait.
Catatan rilis
Catatan rilis untuk Amazon EMR di EKS 7.2.0
-
Aplikasi yang didukung - AWS SDK for Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1
-
Komponen yang didukung -
aws-sagemaker-spark-sdk
emr-ddb
,emr-goodies
,,emr-s3-select
,emrfs
,hadoop-client
,hudi
,hudi-spark
,iceberg
,spark-kubernetes
. -
Klasifikasi konfigurasi yang didukung
Untuk digunakan dengan StartJobRundan CreateManagedEndpointAPIs:
Klasifikasi Deskripsi core-site
Ubah nilai dalam file
core-site.xml
Hadoop.emrfs-site
Ubah EMRFS pengaturan.
spark-metrics
Ubah nilai dalam file
metrics.properties
Spark.spark-defaults
Ubah nilai dalam file
spark-defaults.conf
Spark.spark-env
Ubah nilai di lingkungan Spark.
spark-hive-site
Ubah nilai dalam file
hive-site.xml
Spark.spark-log4j2
Ubah nilai dalam file
log4j2.properties
Spark.emr-job-submitter
Konfigurasi untuk pod pengirim pekerjaan.
Untuk digunakan secara khusus dengan CreateManagedEndpointAPIs:
Klasifikasi Deskripsi jeg-config
Ubah nilai dalam file Jupyter Enterprise Gateway
jupyter_enterprise_gateway_config.py
.jupyter-kernel-overrides
Ubah nilai untuk Gambar Kernel di file Spesifikasi Kernel Jupyter.
Klasifikasi konfigurasi memungkinkan Anda menyesuaikan aplikasi. Ini sering sesuai dengan XML file konfigurasi untuk aplikasi, seperti
spark-hive-site.xml
. Untuk informasi selengkapnya, lihat Mengkonfigurasi Aplikasi.
Fitur penting
Fitur-fitur berikut disertakan dengan rilis 7.2.0 Amazon EMR diEKS.
-
Peningkatan aplikasi - Amazon EMR pada peningkatan aplikasi EKS 7.2.0 termasuk Spark 3.5.1, Flink 1.18.1, dan Flink Operator 1.8.0.
-
Autoscaler untuk pembaruan Flink - Rilis 7.2.0 menggunakan konfigurasi open source
job.autoscaler.restart.time-tracking.enabled
untuk mengaktifkan estimasi waktu penskalaan ulang, jadi Anda tidak perlu lagi menetapkan nilai empiris secara manual untuk memulai ulang waktu. Jika Anda menjalankan 7.1.0 atau lebih rendah, Anda masih dapat menggunakan penskalaan EMR otomatis Amazon. -
Integrasi Apache Hudi Apache Flink di EMR Amazon EKS di - Rilis ini menambahkan integrasi antara Apache Hudi dan Apache Flink, sehingga Anda dapat menggunakan operator Flink Kubernetes untuk menjalankan pekerjaan Hudi. Hudi memungkinkan Anda menggunakan operasi tingkat rekaman yang dapat Anda gunakan untuk menyederhanakan manajemen data dan pengembangan pipa data.
-
Integrasi Amazon S3 Express One Zone dengan EMR Amazon aktif EKS - Dengan 7.2.0 dan yang lebih tinggi, Anda dapat mengunggah data ke S3 Express One Zone dengan Amazon aktif. EMR EKS S3 Express One Zone adalah kelas penyimpanan Amazon S3 zona tunggal berkinerja tinggi yang memberikan akses data milidetik satu digit yang konsisten untuk sebagian besar aplikasi yang sensitif terhadap latensi. Pada saat rilis, S3 Express One Zone memberikan latensi terendah dan penyimpanan objek cloud kinerja tertinggi di Amazon S3.
-
Support untuk konfigurasi default di operator Spark - Operator Spark di Amazon EKS sekarang mendukung konfigurasi default yang sama dengan model start job run EMR di Amazon EKS untuk 7.2.0 dan yang lebih tinggi. Ini berarti bahwa fitur seperti Amazon S3 dan EMRFS tidak lagi memerlukan konfigurasi manual dalam file yaml.