Versiones de Amazon EMR en EKS 6.12.0
Esta página describe la funcionalidad nueva y actualizada de Amazon EMR que es específica de la implementación de Amazon EMR en EKS. Para obtener más información sobre las ejecuciones de Amazon EMR en Amazon EC2 y sobre la versión 6.12.0 de Amazon EMR en general, consulte Amazon EMR 6.12.0 en la Guía de publicación de Amazon EMR.
Versiones de Amazon EMR en EKS 6.12
Las siguientes versiones de Amazon EMR 6.12.0 están disponibles para Amazon EMR en EKS. Seleccione una versión específica de emr-6.12.0-XXXX para ver más detalles, como la etiqueta de imagen de contenedor relacionada.
-
emr-6.12.0-spark-rapids-latest
-
emr-6.12.0-spark-rapids-20230701
-
emr-6.12.0-java11-latest
-
emr-6.12.0-java11-20230701
-
emr-6.12.0-java17-latest
-
emr-6.12.0-java17-20230701
-
emr-6.12.0-spark-rapids-java17-latest
-
emr-6.12.0-spark-rapids-java17-20230701
-
notebook-spark/emr-6.12.0-latest
-
notebook-spark/emr-6.12.0-20230701
-
notebook-spark/emr-6.12.0-spark-rapids-latest
-
notebook-spark/emr-6.12.0-spark-rapids-20230701
-
notebook-python/emr-6.12.0-latest
-
notebook-python/emr-6.12.0-20230701
-
notebook-python/emr-6.12.0-spark-rapids-latest
-
notebook-python/emr-6.12.0-spark-rapids-20230701
Notas de la versión
Notas de la versión de Amazon EMR en EKS 6.12.0
-
Aplicaciones compatibles: AWS SDK for Java 1.12.490, Apache Spark 3.4.0-amzn-0, Apache Hudi 0.13.1-amzn-0, Apache Iceberg 1.3.0-amzn-0, Delta 2.4.0, Apache Spark RAPIDS 23.06.0-amzn-0, Jupyter Enterprise Gateway 2.6.0
-
Componentes compatibles:
aws-sagemaker-spark-sdk
,emr-ddb
,emr-goodies
,emr-s3-select
,emrfs
,hadoop-client
,hudi
,hudi-spark
,iceberg
,spark-kubernetes
. -
Clasificaciones de configuración compatibles
Para usar con las API StartJobRun y CreateManagedEndpoint:
Clasificaciones Descripciones core-site
Cambia los valores en el archivo de Hadoop
core-site.xml
.emrfs-site
Cambiar la configuración de EMRFS.
spark-metrics
Cambia los valores en el archivo de Spark
metrics.properties
.spark-defaults
Cambia los valores en el archivo de Spark
spark-defaults.conf
.spark-env
Cambiar los valores en el entorno de Spark.
spark-hive-site
Cambia los valores en el archivo de Spark
hive-site.xml
.spark-log4j
Cambia los valores en el archivo de Spark
log4j2.properties
.emr-job-submitter
Configuración del pod de remitente de trabajos.
Para usar específicamente con las API CreateManagedEndpoint:
Clasificaciones Descripciones jeg-config
Cambia los valores en el archivo
jupyter_enterprise_gateway_config.py
de Jupyter Enterprise Gateway.jupyter-kernel-overrides
Cambia el valor de la imagen del kernel en el archivo de especificaciones del kernel de Jupyter.
Las clasificaciones de configuración le permiten personalizar las aplicaciones. Suelen corresponder a un archivo XML de configuración para la aplicación como, por ejemplo,
spark-hive-site.xml
. Para obtener más información, consulte Configurar aplicaciones.
Características notables
Las siguientes características se incluyen en la versión 6.12 de Amazon EMR en EKS.
-
Java 17: con Amazon EMR en EKS 6.12 y versiones posteriores, puede lanzar Spark con el tiempo de ejecución de Java 17. Para ello, pase
emr-6.12.0-java17-latest
como una etiqueta de versión. Le recomendamos que valide y ejecute pruebas de rendimiento antes de trasladar las cargas de trabajo de producción de versiones anteriores de la imagen de Java a la imagen de Java 17.