Versionen von Amazon EMR auf EKS 7.2.0

Auf dieser Seite werden die neuen und aktualisierten Funktionen für Amazon EMR beschrieben, die spezifisch für die Bereitstellung von Amazon EMR in EKS sind. Einzelheiten zur Ausführung von Amazon EMR auf Amazon EC2 und zur Amazon EMR 7.2.0-Version im Allgemeinen finden Sie unter Amazon EMR 7.2.0 im Amazon EMR-Versionshandbuch.

Amazon EMR auf EKS 7.2-Versionen

Die folgenden Amazon EMR 7.2.0-Versionen sind für Amazon EMR auf EKS verfügbar. Wählen Sie eine bestimmte EMR-7.2.0-xxxx-Version aus, um weitere Details wie das zugehörige Container-Image-Tag anzuzeigen.

Flink releases

Die folgenden Amazon EMR 7.2.0-Versionen sind für Amazon EMR auf EKS verfügbar, wenn Sie Flink-Anwendungen ausführen.

Spark releases

Die folgenden Amazon EMR 7.2.0-Versionen sind für Amazon EMR auf EKS verfügbar, wenn Sie Spark-Anwendungen ausführen.

emr-7.2.0-aktuell
emr-7.2.0-20240610
emr-7.2.0-spark-rapids-latest
emr-7.2.0-spark-rapids-20240610
emr-7.2.0-java11-latest
emr-7.2.0-java11-20240610
emr-7.2.0-java8-latest
emr-7.2.0-java8-20240610
emr-7.2.0-spark-rapids-java8-latest
emr-7.2.0-spark-rapids-java8-20240610
notebook-spark/emr-7.2.0-latest
notebook-spark/emr-7.2.0-20240610
notebook-spark/emr-7.2.0-spark-rapids-latest
notebook-spark/emr-7.2.0-spark-rapids-20240610
notebook-spark/emr-7.2.0-java11-latest
notebook-spark/emr-7.2.0-java11-20240610
notebook-spark/emr-7.2.0-java8-latest
notebook-spark/emr-7.2.0-java8-20240610
notebook-spark/emr-7.2.0-spark-rapids-java8-latest
notebook-spark/emr-7.2.0-spark-rapids-java8-20240610
notebook-python/emr-7.2.0-latest
notebook-python/emr-7.2.0-20240610
notebook-python/emr-7.2.0-spark-rapids-latest
notebook-python/emr-7.2.0-spark-rapids-20240610
notebook-python/emr-7.2.0-java11-latest
notebook-python/emr-7.2.0-java11-20240610
notebook-python/emr-7.2.0-java8-latest
notebook-python/emr-7.2.0-java8-20240610
notebook-python/emr-7.2.0-spark-rapids-java8-latest
notebook-python/emr-7.2.0-spark-rapids-java8-20240610
livy/emr-7.2.0-latest
livy/emr-7.2.0-20240610
livy/emr-7.2.0-java11-latest
livy/emr-7.2.0-java11-20240610
livy/emr-7.2.0-java8-latest
livy/emr-7.2.0-java8-20240610

Versionshinweise

Versionshinweise für Amazon EMR auf EKS 7.2.0

Unterstützte Anwendungen ‐ AWS SDK for Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1
Unterstützte Komponenten – aws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg, spark-kubernetes.

Unterstützte Konfigurationsklassifizierungen

Zur Verwendung mit StartJobRunund CreateManagedEndpoint APIs:

Klassifizierungen	Beschreibungen
`core-site`	Ändern Sie die Werte in der `core-site.xml`-Hadoop-Datei.
`emrfs-site`	Ändert die EMRFS-Einstellungen.
`spark-metrics`	Ändern Sie die Werte in der `metrics.properties`-Spark-Datei.
`spark-defaults`	Ändern Sie die Werte in der `spark-defaults.conf`-Spark-Datei.
`spark-env`	Ändert die Werte in der Spark-Umgebung.
`spark-hive-site`	Ändern Sie die Werte in der `hive-site.xml`-Spark-Datei.
`spark-log4j2`	Ändern Sie die Werte in der `log4j2.properties`-Spark-Datei.
`emr-job-submitter`	Konfiguration für den Auftragsübermittler-Pod.

Speziell zur Verwendung mit CreateManagedEndpoint APIs:

Klassifizierungen	Beschreibungen
`jeg-config`	Ändern Sie die Werte in der Jupyter-Enterprise-Gateway-Datei `jupyter_enterprise_gateway_config.py`.
`jupyter-kernel-overrides`	Ändern Sie den Wert für das Kernel-Image in der Jupyter-Kernel-Spec-Datei.

Mithilfe von Konfigurationsklassifizierungen können Sie Anwendungen anpassen. Diese entsprechen häufig einer XML-Konfigurationsdatei für die Anwendung, z. B. spark-hive-site.xml Weitere Informationen finden Sie unter Konfigurieren von Anwendungen.

Bemerkenswerte Features

Die folgenden Funktionen sind in der Version 7.2.0 von Amazon EMR on EKS enthalten.

Anwendungs-Upgrades — Zu den Anwendungs-Upgrades von Amazon EMR auf EKS 7.2.0 gehören Spark 3.5.1, Flink 1.18.1 und Flink Operator 1.8.0.
Autoscaler für Flink-Updates — Die Version 7.2.0 verwendet die Open-Source-Konfiguration, um die Schätzung der Neuskalierungszeit job.autoscaler.restart.time-tracking.enabled zu ermöglichen, sodass Sie der Neustartzeit keine empirischen Werte mehr manuell zuweisen müssen. Wenn Sie 7.1.0 oder niedriger ausführen, können Sie weiterhin Amazon EMR Autoscaling verwenden.
Apache Hudi-Integration Apache Flink auf Amazon EMR auf EKS — Diese Version fügt eine Integration zwischen Apache Hudi und Apache Flink hinzu, sodass Sie den Flink Kubernetes-Operator verwenden können, um Hudi-Jobs auszuführen. Mit Hudi können Sie Operationen auf Datensatzebene verwenden, mit denen Sie das Datenmanagement und die Entwicklung von Datenleitungen vereinfachen können.
Amazon S3 Express One Zone-Integration mit Amazon EMR auf EKS — Mit 7.2.0 und höher können Sie mit Amazon EMR auf EKS Daten in die S3 Express One Zone hochladen. S3 Express One Zone ist eine leistungsstarke Amazon S3 S3-Speicherklasse mit einer Zone, die für die meisten latenzempfindlichen Anwendungen einen konsistenten Datenzugriff im einstelligen Millisekundenbereich bietet. Zum Zeitpunkt seiner Veröffentlichung bietet S3 Express One Zone den Cloud-Objektspeicher mit der niedrigsten Latenz und der höchsten Leistung in Amazon S3.
Support für Standardkonfigurationen im Spark-Operator — Der Spark-Operator auf Amazon EKS unterstützt jetzt dieselben Standardkonfigurationen wie das Start-Job-Run-Modell auf Amazon EMR auf EKS für 7.2.0 und höher. Das bedeutet, dass Funktionen wie Amazon S3 und EMRFS keine manuellen Konfigurationen in der Yaml-Datei mehr erfordern.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

emr-7.3.0-flink-29240920

emr-7.2.0-aktuell