Amazon EMR nelle versioni EKS 7.2.0

Questa pagina descrive le funzionalità nuove e aggiornate per Amazon EMR specifiche per Amazon EMR on EKS deployment. Per dettagli su Amazon EMR in esecuzione su Amazon EC2 e sulla versione Amazon EMR 7.2.0 in generale, consulta Amazon EMR 7.2.0 nella Amazon EMR Release Guide.

Amazon EMR nelle versioni EKS 7.2

Le seguenti versioni di Amazon EMR 7.2.0 sono disponibili per Amazon EMR suEKS. Seleziona una XXXX versione specifica di emr-7.2.0- per visualizzare ulteriori dettagli, come il relativo tag con l'immagine del contenitore.

Flink releases

Le seguenti versioni di Amazon EMR 7.2.0 sono disponibili per Amazon EMR su EKS quando esegui applicazioni Flink.

Spark releases

Le seguenti versioni di Amazon EMR 7.2.0 sono disponibili per Amazon EMR su EKS quando esegui applicazioni Spark.

emr-7.2.0-più recente
emr-7.2.0-20240610
emr-7.2.0-spark-rapids-latest
emr-7.2.0-spark-rapids-20240610
emr-7.2.0-java11-latest
emr-7.2.0-java11-20240610
emr-7.2.0-java8-latest
emr-7.2.0-java8-20240610
emr-7.2.0-spark-rapids-java8-latest
emr-7.2.0-spark-rapids-java8-20240610
notebook-spark/emr-7.2.0-latest
notebook-spark/emr-7.2.0-20240610
notebook-spark/emr-7.2.0-spark-rapids-latest
notebook-spark/emr-7.2.0-spark-rapids-20240610
notebook-spark/emr-7.2.0-java11-latest
notebook-spark/emr-7.2.0-java11-20240610
notebook-spark/emr-7.2.0-java8-latest
notebook-spark/emr-7.2.0-java8-20240610
notebook-spark/emr-7.2.0-spark-rapids-java8-latest
notebook-spark/emr-7.2.0-spark-rapids-java8-20240610
notebook-python/emr-7.2.0-latest
notebook-python/emr-7.2.0-20240610
notebook-python/emr-7.2.0-spark-rapids-latest
notebook-python/emr-7.2.0-spark-rapids-20240610
notebook-python/emr-7.2.0-java11-latest
notebook-python/emr-7.2.0-java11-20240610
notebook-python/emr-7.2.0-java8-latest
notebook-python/emr-7.2.0-java8-20240610
notebook-python/emr-7.2.0-spark-rapids-java8-latest
notebook-python/emr-7.2.0-spark-rapids-java8-20240610
livy/emr-7.2.0-latest
livy/emr-7.2.0-20240610
livy/emr-7.2.0-java11-latest
livy/emr-7.2.0-java11-20240610
livy/emr-7.2.0-java8-latest
livy/emr-7.2.0-java8-20240610

Note di rilascio

Note di rilascio per Amazon EMR sulla versione EKS 7.2.0

Applicazioni supportate ‐ AWS SDK for Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1
Componenti supportati: aws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg, spark-kubernetes.

Classificazioni di configurazione supportate

Da usare con StartJobRune CreateManagedEndpointAPIs:

Classificazioni	Descrizioni
`core-site`	Modifica i valori nel file Hadoop `core-site.xml`.
`emrfs-site`	Modificare EMRFS le impostazioni.
`spark-metrics`	Modifica i valori nel file Spark `metrics.properties`.
`spark-defaults`	Modifica i valori nel file Spark `spark-defaults.conf`.
`spark-env`	Modifica i valori nell'ambiente Spark.
`spark-hive-site`	Modifica i valori nel file Spark `hive-site.xml`.
`spark-log4j2`	Modifica i valori nel file Spark `log4j2.properties`.
`emr-job-submitter`	Configurazione per il pod del mittente di processi.

Da utilizzare specificamente con CreateManagedEndpointAPIs:

Classificazioni	Descrizioni
`jeg-config`	Modifica i valori nel file `jupyter_enterprise_gateway_config.py` Jupyter Enterprise Gateway.
`jupyter-kernel-overrides`	Modifica il valore per l'immagine del kernel nel file Jupyter Kernel Spec.

Le classificazioni di configurazione consentono di personalizzare le applicazioni. Spesso corrispondono a un XML file di configurazione per l'applicazione, ad esempiospark-hive-site.xml. Per ulteriori informazioni, consulta la sezione Configurazione delle applicazioni.

Funzionalità significative

Le seguenti funzionalità sono incluse nella versione 7.2.0 di Amazon EMR onEKS.

Aggiornamenti delle applicazioni: gli aggiornamenti delle applicazioni Amazon EMR on EKS 7.2.0 includono Spark 3.5.1, Flink 1.18.1 e Flink Operator 1.8.0.
Aggiornamenti di Autoscaler for Flink: la versione 7.2.0 utilizza la configurazione open source per consentire la stima del tempo di ridimensionamento, in modo da non dover più job.autoscaler.restart.time-tracking.enabled assegnare manualmente valori empirici al tempo di riavvio. Se utilizzi la versione 7.1.0 o una versione precedente, puoi comunque utilizzare Amazon EMR autoscaling.
Integrazione con Apache Hudi Apache Flink su EMR Amazon EKS on — Questa versione aggiunge un'integrazione tra Apache Hudi e Apache Flink, in modo da poter utilizzare l'operatore Flink Kubernetes per eseguire i job Hudi. Hudi consente di utilizzare operazioni a livello di record che è possibile utilizzare per semplificare la gestione dei dati e lo sviluppo di pipeline di dati.
Integrazione di Amazon S3 Express One Zone con Amazon EMR on EKS: con la versione 7.2.0 e versioni successive, puoi caricare dati in S3 Express One Zone con Amazon on. EMR EKS S3 Express One Zone è una classe di storage Amazon S3 a zona singola ad alte prestazioni che offre un accesso ai dati coerente a una cifra in millisecondi per la maggior parte delle applicazioni sensibili alla latenza. Al momento del suo rilascio, S3 Express One Zone offre lo storage di oggetti cloud con la latenza più bassa e le prestazioni più elevate in Amazon S3.
Supporto per le configurazioni predefinite nell'operatore Spark: l'operatore Spark su Amazon EKS ora supporta le stesse configurazioni predefinite del modello start job run EMR su Amazon EKS per 7.2.0 e versioni successive. Ciò significa che funzionalità come Amazon S3 EMRFS non richiedono più configurazioni manuali nel file yaml.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

emr-7.3.0-flink-29240920

emr-7.2.0-più recente