Amazon EMR auf EKS 6.10.0-Versionen - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon EMR auf EKS 6.10.0-Versionen

Die folgenden Amazon EMR 6.10.0-Versionen sind für Amazon EMR am EKS verfügbar. Wählen Sie eine bestimmte XXXXemr-6.10.0-Version aus, um weitere Details wie das zugehörige Container-Image-Tag anzuzeigen.

Versionshinweise für Amazon EMR 6.10.0

  • Unterstützte Anwendungen ‐ AWS SDK for Java 1.12.397, Spark 3.3.1-amzn-0, Hudi 0.12.2-amzn-0, Iceberg 1.1.0-amzn-0, Delta 2.2.0.

  • Unterstützte Komponenten – aws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg, spark-kubernetes.

  • Unterstützte Konfigurationsklassifizierungen:

    StartJobRunZur Verwendung CreateManagedEndpointAPIsmit und:

    Klassifizierungen Beschreibungen

    core-site

    Ändern Sie die Werte in der core-site.xml-Hadoop-Datei.

    emrfs-site

    EMRFSEinstellungen ändern.

    spark-metrics

    Ändern Sie die Werte in der metrics.properties-Spark-Datei.

    spark-defaults

    Ändern Sie die Werte in der spark-defaults.conf-Spark-Datei.

    spark-env

    Ändert die Werte in der Spark-Umgebung.

    spark-hive-site

    Ändern Sie die Werte in der hive-site.xml-Spark-Datei.

    spark-log4j

    Ändern Sie die Werte in der log4j.properties-Spark-Datei.

    Speziell zur Verwendung mit CreateManagedEndpointAPIs:

    Klassifizierungen Beschreibungen

    jeg-config

    Ändern Sie die Werte in der Jupyter-Enterprise-Gateway-Datei jupyter_enterprise_gateway_config.py.

    jupyter-kernel-overrides

    Ändern Sie den Wert für das Kernel-Image in der Jupyter-Kernel-Spec-Datei.

    Mithilfe von Konfigurationsklassifizierungen können Sie Anwendungen anpassen. Diese entsprechen häufig einer XML Konfigurationsdatei für die Anwendung, wie spark-hive-site.xml z. Weitere Informationen finden Sie unter Konfigurieren von Anwendungen.

Bemerkenswerte Features

  • Spark-Operator — Mit Amazon EMR auf EKS Version 6.10.0 und höher können Sie den Kubernetes-Operator für Apache Spark oder den Spark-Operator verwenden, um Spark-Anwendungen mit der Amazon EMR Release-Laufzeit auf Ihren eigenen Amazon-Clustern bereitzustellen und zu verwalten. EKS Weitere Informationen finden Sie unter Spark-Aufträge mit dem Spark-Operator ausführen.

  • Java 11 — Mit Amazon EMR auf Version EKS 6.10 und höher können Sie Spark mit Java 11-Runtime starten. Geben Sie dazu emr-6.10.0-java11-latest als Versionskennung ein. Wir empfehlen, dass Sie Leistungstests validieren und ausführen, bevor Sie Ihre Produktionsworkloads vom Java-8-Image auf das Java-11-Image verschieben.

  • Für die Amazon Redshift Redshift-Integration für Apache Spark entfernt Amazon EMR in EKS Version 6.10.0 die Abhängigkeit minimal-json.jar von und fügt die erforderlichen spark-redshift zugehörigen JAR-Dateien automatisch zum Executor-Klassenpfad für Spark hinzu:spark-redshift.jar, und. spark-avro.jar RedshiftJDBC.jar

Änderungen

  • EMRFSDer S3-optimierte Committer ist jetzt standardmäßig für Parquet- und textbasierte Formate (einschließlich ORC und) aktiviert. CSV JSON