Versionen von Amazon EMR auf EKS 7.2.0 - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Versionen von Amazon EMR auf EKS 7.2.0

Auf dieser Seite werden die neuen und aktualisierten Funktionen für Amazon EMR beschrieben, die spezifisch für die Bereitstellung von Amazon EMR in EKS sind. Einzelheiten zur Ausführung von Amazon EMR auf Amazon EC2 und zur Amazon EMR 7.2.0-Version im Allgemeinen finden Sie unter Amazon EMR 7.2.0 im Amazon EMR-Versionshandbuch.

Amazon EMR auf EKS 7.2-Versionen

Die folgenden Amazon EMR 7.2.0-Versionen sind für Amazon EMR auf EKS verfügbar. Wählen Sie eine bestimmte EMR-7.2.0-xxxx-Version aus, um weitere Details wie das zugehörige Container-Image-Tag anzuzeigen.

Flink releases

Die folgenden Amazon EMR 7.2.0-Versionen sind für Amazon EMR auf EKS verfügbar, wenn Sie Flink-Anwendungen ausführen.

Spark releases

Die folgenden Amazon EMR 7.2.0-Versionen sind für Amazon EMR auf EKS verfügbar, wenn Sie Spark-Anwendungen ausführen.

  • emr-7.2.0-aktuell

  • emr-7.2.0-20240610

  • emr-7.2.0-spark-rapids-latest

  • emr-7.2.0-spark-rapids-20240610

  • emr-7.2.0-java11-latest

  • emr-7.2.0-java11-20240610

  • emr-7.2.0-java8-latest

  • emr-7.2.0-java8-20240610

  • emr-7.2.0-spark-rapids-java8-latest

  • emr-7.2.0-spark-rapids-java8-20240610

  • notebook-spark/emr-7.2.0-latest

  • notebook-spark/emr-7.2.0-20240610

  • notebook-spark/emr-7.2.0-spark-rapids-latest

  • notebook-spark/emr-7.2.0-spark-rapids-20240610

  • notebook-spark/emr-7.2.0-java11-latest

  • notebook-spark/emr-7.2.0-java11-20240610

  • notebook-spark/emr-7.2.0-java8-latest

  • notebook-spark/emr-7.2.0-java8-20240610

  • notebook-spark/emr-7.2.0-spark-rapids-java8-latest

  • notebook-spark/emr-7.2.0-spark-rapids-java8-20240610

  • notebook-python/emr-7.2.0-latest

  • notebook-python/emr-7.2.0-20240610

  • notebook-python/emr-7.2.0-spark-rapids-latest

  • notebook-python/emr-7.2.0-spark-rapids-20240610

  • notebook-python/emr-7.2.0-java11-latest

  • notebook-python/emr-7.2.0-java11-20240610

  • notebook-python/emr-7.2.0-java8-latest

  • notebook-python/emr-7.2.0-java8-20240610

  • notebook-python/emr-7.2.0-spark-rapids-java8-latest

  • notebook-python/emr-7.2.0-spark-rapids-java8-20240610

  • livy/emr-7.2.0-latest

  • livy/emr-7.2.0-20240610

  • livy/emr-7.2.0-java11-latest

  • livy/emr-7.2.0-java11-20240610

  • livy/emr-7.2.0-java8-latest

  • livy/emr-7.2.0-java8-20240610

Versionshinweise

Versionshinweise für Amazon EMR auf EKS 7.2.0

  • Unterstützte Anwendungen ‐ AWS SDK for Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1

  • Unterstützte Komponentenaws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg, spark-kubernetes.

  • Unterstützte Konfigurationsklassifizierungen

    Zur Verwendung mit StartJobRunund CreateManagedEndpoint APIs:

    Klassifizierungen Beschreibungen

    core-site

    Ändern Sie die Werte in der core-site.xml-Hadoop-Datei.

    emrfs-site

    Ändert die EMRFS-Einstellungen.

    spark-metrics

    Ändern Sie die Werte in der metrics.properties-Spark-Datei.

    spark-defaults

    Ändern Sie die Werte in der spark-defaults.conf-Spark-Datei.

    spark-env

    Ändert die Werte in der Spark-Umgebung.

    spark-hive-site

    Ändern Sie die Werte in der hive-site.xml-Spark-Datei.

    spark-log4j2

    Ändern Sie die Werte in der log4j2.properties-Spark-Datei.

    emr-job-submitter

    Konfiguration für den Auftragsübermittler-Pod.

    Speziell zur Verwendung mit CreateManagedEndpoint APIs:

    Klassifizierungen Beschreibungen

    jeg-config

    Ändern Sie die Werte in der Jupyter-Enterprise-Gateway-Datei jupyter_enterprise_gateway_config.py.

    jupyter-kernel-overrides

    Ändern Sie den Wert für das Kernel-Image in der Jupyter-Kernel-Spec-Datei.

    Mithilfe von Konfigurationsklassifizierungen können Sie Anwendungen anpassen. Diese entsprechen häufig einer XML-Konfigurationsdatei für die Anwendung, z. B. spark-hive-site.xml Weitere Informationen finden Sie unter Konfigurieren von Anwendungen.

Bemerkenswerte Features

Die folgenden Funktionen sind in der Version 7.2.0 von Amazon EMR on EKS enthalten.

  • Anwendungs-Upgrades — Zu den Anwendungs-Upgrades von Amazon EMR auf EKS 7.2.0 gehören Spark 3.5.1, Flink 1.18.1 und Flink Operator 1.8.0.

  • Autoscaler für Flink-Updates — Die Version 7.2.0 verwendet die Open-Source-Konfiguration, um die Schätzung der Neuskalierungszeit job.autoscaler.restart.time-tracking.enabled zu ermöglichen, sodass Sie der Neustartzeit keine empirischen Werte mehr manuell zuweisen müssen. Wenn Sie 7.1.0 oder niedriger ausführen, können Sie weiterhin Amazon EMR Autoscaling verwenden.

  • Apache Hudi-Integration Apache Flink auf Amazon EMR auf EKS — Diese Version fügt eine Integration zwischen Apache Hudi und Apache Flink hinzu, sodass Sie den Flink Kubernetes-Operator verwenden können, um Hudi-Jobs auszuführen. Mit Hudi können Sie Operationen auf Datensatzebene verwenden, mit denen Sie das Datenmanagement und die Entwicklung von Datenleitungen vereinfachen können.

  • Amazon S3 Express One Zone-Integration mit Amazon EMR auf EKS — Mit 7.2.0 und höher können Sie mit Amazon EMR auf EKS Daten in die S3 Express One Zone hochladen. S3 Express One Zone ist eine leistungsstarke Amazon S3 S3-Speicherklasse mit einer Zone, die für die meisten latenzempfindlichen Anwendungen einen konsistenten Datenzugriff im einstelligen Millisekundenbereich bietet. Zum Zeitpunkt seiner Veröffentlichung bietet S3 Express One Zone den Cloud-Objektspeicher mit der niedrigsten Latenz und der höchsten Leistung in Amazon S3.

  • Support für Standardkonfigurationen im Spark-Operator — Der Spark-Operator auf Amazon EKS unterstützt jetzt dieselben Standardkonfigurationen wie das Start-Job-Run-Modell auf Amazon EMR auf EKS für 7.2.0 und höher. Das bedeutet, dass Funktionen wie Amazon S3 und EMRFS keine manuellen Konfigurationen in der Yaml-Datei mehr erfordern.