Amazon EMR, versión 6.8.1 - Amazon EMR

Amazon EMR, versión 6.8.1

Versiones de las aplicaciones de la versión 6.8.1

Esta versión admite las siguientes aplicaciones: Flink, Ganglia, HBase, HCatalog, Hadoop, Hive, Hudi, Hue, Iceberg, JupyterEnterpriseGateway, JupyterHub, Livy, MXNet, Oozie, Phoenix, Pig, Presto, Spark, Sqoop, TensorFlow, Tez, Trino, Zeppelin y ZooKeeper.

En la siguiente tabla se enumeran las versiones de la aplicación disponibles en esta versión de Amazon EMR y las versiones de la aplicación en las tres versiones anteriores de Amazon EMR (cuando corresponda).

Para ver un historial completo de las versiones de la aplicación disponibles para cada versión de Amazon EMR, consulte los temas siguientes:

Información sobre la versión de la aplicación
emr-6.8.1 emr-6.8.0 emr-6.7.0 emr-6.6.0
AWS SDK para Java 1.12.1701.12.1701.12.1701.12.170
Python 2.7, 3.72.7, 3.72.7, 3.72.7, 3.7
Scala 2.12.152.12.152.12.152.12.10
AmazonCloudWatchAgent - - - -
Delta - - - -
Flink1.15.11.15.11.14.21.14.2
Ganglia3.7.23.7.23.7.23.7.2
HBase2.4.122.4.122.4.42.4.4
HCatalog3.1.33.1.33.1.33.1.2
Hadoop3.2.13.2.13.2.13.2.1
Hive3.1.33.1.33.1.33.1.2
Hudi0.11.1-amzn-00.11.1-amzn-00.11.0-amzn-00.10.1-amzn-0
Hue4.10.04.10.04.10.04.10.0
Iceberg0.14.0-amzn-00.14.0-amzn-00.13.1-amzn-00.13.1
JupyterEnterpriseGateway2.1.02.1.02.1.02.1.0
JupyterHub1.4.11.4.11.4.11.4.1
Livy0.7.10.7.10.7.10.7.1
MXNet1.9.11.9.11.8.01.8.0
Mahout - - - -
Oozie5.2.15.2.15.2.15.2.1
Phoenix5.1.25.1.25.1.25.1.2
Pig0.17.00.17.00.17.00.17.0
Presto0.2730.2730.2720.267
Spark3.3.03.3.03.2.13.2.0
Sqoop1.4.71.4.71.4.71.4.7
TensorFlow2.9.12.9.12.4.12.4.1
Tez0.9.20.9.20.9.20.9.2
Trino (PrestoSQL)388388378367
Zeppelin0.10.10.10.10.10.00.10.0
ZooKeeper3.5.103.5.103.5.73.5.7

Notas de la versión 6.8.1

Las siguientes notas de la versión incluyen información sobre la versión 6.8.1 de Amazon EMR. Los cambios son respecto a la versión 6.8.0. Para obtener información sobre el cronograma de lanzamiento, consulte el Registro de cambios de la versión 6.8.1.

Cambios, mejoras y problemas resueltos
  • Hadoop 3.3.3 ha introducido un cambio en YARN (YARN-9608) que mantiene los nodos donde se ejecutaron los contenedores en un estado de retirada hasta que se complete la aplicación. Este cambio garantiza que los datos locales, como los datos de mezclas aleatorias, no se pierdan y que no sea necesario volver a ejecutar el trabajo. Este enfoque también puede provocar una infrautilización de los recursos en los clústeres con o sin el escalado administrado habilitado.

    En las versiones 6.11.0 y posteriores de Amazon EMR, así como en las 6.8.1, 6.9.1 y 6.10.1, el valor de yarn.resourcemanager.decommissioning-nodes-watcher.wait-for-applications se establece como false en yarn-site.xml para resolver este problema.

    Si bien la corrección soluciona los problemas que ha introducido YARN-9608, es posible que los trabajos de Hive presenten errores debido a la pérdida de datos de mezclas aleatorias en los clústeres que tienen habilitado el escalado administrado. Se ha mitigado ese riesgo en esta versión al configurar también yarn.resourcemanager.decommissioning-nodes-watcher.wait-for-shuffle-data para las cargas de trabajo de Hive. Esta configuración solo está disponible con la versión 6.11.0 y posteriores de Amazon EMR.

  • El recopilador de métricas no enviará ninguna métrica al plano de control después de una conmutación por error del nodo principal en los clústeres con la configuración de grupos de instancias.

  • Esta versión elimina los reintentos de las solicitudes HTTP con errores a los puntos de conexión del recopilador de métricas.

  • Esta versión incluye un cambio que permite que los clústeres de alta disponibilidad se recuperen de un estado de error tras el reinicio.

  • Esta versión corrige un problema por el que los UID grandes creados por los usuarios provocaban excepciones por desbordamiento.

  • Esta versión corrige los problemas de tiempo de espera con el proceso de reconfiguración de Amazon EMR.

  • Esta versión evita un problema en el que una reconfiguración con errores podría interrumpir otros procesos no relacionados.

  • Esta versión incluye correcciones de seguridad.

  • Esta versión corrige un problema por el que los clústeres que ejecutan cargas de trabajo en Spark con Amazon EMR podrían recibir silenciosamente resultados incorrectos con contains, startsWith, endsWith y like. Este problema se produce cuando utiliza las expresiones en campos particionados que tienen metadatos en Hive3 Metastore Server (HMS) de Amazon EMR.

  • Con las versiones 6.6.0 a 6.9.x de Amazon EMR, las consultas INSERT con partición dinámica y una cláusula ORDER BY o SORT BY siempre tendrán dos reductores. Este problema se debe al cambio HIVE-20703 de OSS, que sitúa la optimización de la clasificación dinámica de las particiones en una decisión basada en los costos. Si su carga de trabajo no requiere ordenar las particiones dinámicas, le recomendamos que establezca la propiedad hive.optimize.sort.dynamic.partition.threshold en -1 para deshabilitar la nueva característica y obtener el número de reductores calculado correctamente. Este problema se ha corregido en OSS Hive como parte de HIVE-22269 y se ha corregido en Amazon EMR 6.10.0.

  • Es posible que Hive pierda datos si utiliza HDFS como directorio temporal y ha habilitado la combinación de archivos pequeños, y la tabla contiene rutas de partición estáticas.

  • Esta versión corrige un problema de rendimiento con Hive si la combinación de archivos pequeños (deshabilitada de forma predeterminada) se habilita al final del trabajo de ETL.

  • Esta versión corrige un problema con la limitación en Glue cuando no hay funciones definidas por el usuario (UDF).

  • Esta versión corrige un problema que elimina los registros de contenedores mediante el servicio de agregación de registros de nodos antes de que el insertador de registros pudiera enviarlos a S3 en caso de retirada de YARN.

  • Esta versión corrige la gestión de archivos compactados o archivados con un seguimiento persistente de los archivos de almacenamiento para HBase.

  • Esta versión corrige un problema que afectaba al rendimiento de Spark cuando se establecía un valor true predeterminado para la configuración spark.yarn.heterogeneousExecutors.enabled en spark-defaults.conf.

  • Esta versión corrige un problema que provocaba que la tarea de reducción no pudiera leer los datos de mezclas aleatorias. El problema provocaba errores en las consultas de Hive debido a un error de memoria dañada.

  • Esta versión corrige un problema que provocaba un error en el aprovisionador de nodos si el servicio NameNode (NN) de HDFS se bloqueaba en modo seguro durante la sustitución del nodo.

  • Esta versión agrega un nuevo mecanismo de reintento al flujo de trabajo de escalado de clústeres para clústeres de EMR que ejecutan Presto o Trino. Esta mejora reduce el riesgo de que el cambio de tamaño del clúster se detenga indefinidamente debido a una única operación de cambio de tamaño con errores. También mejora la utilización del clúster, ya que el clúster se escala y reduce verticalmente más rápido.

  • Esta versión mejora la lógica de reducción vertical del clúster para que el clúster no intente reducir verticalmente los nodos principales por debajo de la configuración del factor de replicación de HDFS del clúster. Esto se ajusta a sus requisitos de redundancia de datos y reduce la posibilidad de que una operación de escalado se detenga.

  • El daemon de administración de registros se ha actualizado para identificar todos los registros que están en uso activo con controladores de archivos abiertos en el almacenamiento de instancias local y los procesos asociados. Esta actualización garantiza que Amazon EMR elimine correctamente los archivos y recupere espacio de almacenamiento una vez archivados los registros en Amazon S3.

  • Esta versión incluye una mejora del daemon de administración de registros que elimina los directorios escalonados vacíos y no utilizados del sistema de archivos del clúster local. Un número excesivamente elevado de directorios vacíos puede reducir el rendimiento de los daemons de Amazon EMR y provocar una sobreutilización del disco.

  • Esta versión corrige un problema que podía producirse al crear un nodo de periferia cuando se replicaba uno de los nodos principales de un clúster con varios nodos principales. El nodo de periferia replicado podría provocar retrasos en las operaciones de reducción vertical o provocar un uso elevado de la memoria en los nodos principales. Para más información sobre cómo crear un nodo de periferia para comunicarse con el clúster de EMR, consulte Edge Node Creator en el repositorio de aws-samples de GitHub.

  • Esta versión mejora el proceso de automatización que Amazon EMR utiliza para volver a montar los volúmenes de Amazon EBS en una instancia tras un reinicio.

  • Esta versión corrige un problema que provocaba brechas intermitentes en las métricas de Hadoop que Amazon EMR publica en Amazon CloudWatch.

  • Esta versión corrige un problema con los clústeres de EMR por el que se interrumpe una actualización del archivo de configuración de YARN que contiene la lista de nodos excluidos del clúster debido a una sobreutilización del disco. La actualización incompleta dificulta las futuras operaciones de reducción vertical de los clústeres. Esta versión garantiza que el clúster se mantenga en buen estado y que las operaciones de escalado funcionen según lo previsto.

  • Esta versión mejora el daemon de administración de registros en el clúster para supervisar las carpetas de registro adicionales del clúster de EMR. Esta mejora minimiza los escenarios de sobreutilización del disco.

  • Esta versión reinicia automáticamente el daemon de administración de registros en el clúster cuando se detiene. Esta mejora reduce el riesgo de que los nodos parezcan estar en mal estado debido a la sobreutilización del disco.

  • Esta versión agrega compatibilidad con el archivado de registros en Amazon S3 durante la reducción vertical del clúster. Anteriormente, solo podía archivar archivos de registro en Amazon S3 durante la terminación del clúster. Esta nueva capacidad garantiza que los archivos de registro generados en el clúster persistan en Amazon S3 incluso después de terminar el nodo. Para más información, consulte Configurar el registro y la depuración de un clúster.

  • Esta versión corrige un problema que se producía cuando el URI de Amazon S3 de una acción de arranque terminaba con un número de puerto, por ejemplo: a.b.c.d:4345. Amazon EMR analizaba estos URI de forma incorrecta, por lo que cualquier acción de arranque asociada presentaba errores.

  • Esta versión corrige un problema de desajuste de la secuencia de tiempo entre Apache BigTop y Amazon EMR en la secuencia de inicio del clúster de EC2. Este desajuste de la secuencia de tiempo se produce cuando un sistema intenta llevar a cabo dos o más operaciones al mismo tiempo en lugar de hacerlas en la secuencia correcta. Como resultado, algunas configuraciones de clústeres experimentaron tiempos de espera de inicio de instancias y tiempos de inicio de clústeres más lentos.

  • Al lanzar un clúster con la versión de parche más reciente de Amazon EMR 5.36, 6.6 o 7.0 o sus respectivas versiones posteriores, Amazon EMR utiliza la versión más reciente de Amazon Linux 2023 o Amazon Linux 2 para la AMI de Amazon EMR predeterminada. Para más información, consulte Uso de la AMI de Amazon Linux predeterminada para Amazon EMR.

    OsReleaseLabel (versión de Amazon Linux) Versión de kernel de Amazon Linux Fecha de disponibilidad Regiones admitidas
    2.0.20241001.0 4.14.352 4 de octubre de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Medio Oriente (Baréin), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20240816.0 4.14.350 21 de agosto de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Medio Oriente (Baréin), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20240809.0 4.14.349 20 de agosto de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Medio Oriente (Baréin), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20240719.0 4.14.348 25 de julio de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Medio Oriente (Baréin), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20240709.1 4.14.348 23 de julio de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), África (Ciudad del Cabo), América del Sur (São Paulo), Medio Oriente (Baréin), Canadá (centro), GovCloud de AWS (Oeste de EE. UU.), GovCloud de AWS (Este de EE. UU.), China (Pekín), China (Ningxia) Asia-Pacífico (Hyderabad), Medio Oriente (EAU), Europa (España), Europa (Zúrich), Asia-Pacífico (Melbourne), Israel (Tel Aviv)
    2.0.20240223.0 4.14.336 8 de marzo de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20240131.0 4.14.336 14 de febrero de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20240124.0 4.14.336 7 de febrero de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20240109.0 4.14.334 24 de enero de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20231218.0 4.14.330 2 de enero de 2024 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20231206.0 4.14.330 22 de diciembre de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20231116.0 4.14.328 11 de diciembre de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20231101.0 4.14.327 16 de noviembre de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20231020.1 4.14.326 7 de noviembre de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20231012.1 4.14.326 26 de octubre de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20230926.0 4.14.322 19 de octubre de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro), Israel (Tel Aviv), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), China (Pekín), China (Ningxia)
    2.0.20230906.0 4.14.322 4 de octubre de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro)
    2.0.20230822.0 4.14.322 30 de agosto de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro)
    2.0.20230808.0 4.14.320 24 de agosto de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), Asia-Pacífico (Melbourne), África (Ciudad del Cabo), América del Sur (São Paulo), Canadá (centro)
    2.0.20230727.0 4.14.320 14 de agosto de 2023 Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Milán), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Osaka), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Yakarta), África (Ciudad del Cabo), América del Sur (São Paulo), Medio Oriente (Baréin), Canadá (centro)

Versiones de los componentes de la versión 6.8.1

A continuación, se muestran los componentes que Amazon EMR instala con esta versión. Algunos se instalan como parte de paquetes de aplicación de Big Data. Otros son exclusivos de Amazon EMR y se instalan para ciertos procesos y características del sistema. Normalmente, estos componentes comienzan con emr o aws. Normalmente, los paquetes de aplicación de macrodatos de la versión más reciente de Amazon EMR son las versiones más recientes que pueden encontrarse en la comunidad. Intentamos que las versiones de la comunidad estén disponibles en Amazon EMR lo más rápido posible.

Algunos componentes de Amazon EMR son distintos de las versiones que se encuentran en la comunidad. Estos componentes tienen una etiqueta de versión con el formato CommunityVersion-amzn-EmrVersion. La EmrVersion empieza por 0. Por ejemplo, si un componente de la comunidad de código abierto llamado myapp-component con la versión 2.2 se ha modificado tres veces para incluirlo en diferentes versiones de lanzamiento de Amazon EMR, la versión que se mostrará será 2.2-amzn-2.

Componente Versión Descripción
aws-sagemaker-spark-sdk1.4.2SDK de Amazon SageMaker Spark
emr-ddb4.16.0Conector de Amazon DynamoDB para aplicaciones del ecosistema de Hadoop.
emr-goodies3.2.0Bibliotecas especialmente prácticas para el ecosistema de Hadoop.
emr-kinesis3.5.0Conector de Amazon Kinesis para aplicaciones del ecosistema de Hadoop.
emr-notebook-env1.7.0Entorno de Conda para cuaderno de EMR que incluye una puerta de enlace empresarial de Jupyter
emr-s3-dist-cp2.22.0Aplicación de copia distribuida optimizada para Amazon S3.
emr-s3-select2.1.0Conector S3Select de EMR
emrfs2.53.0Conector de Amazon S3 para aplicaciones del ecosistema de Hadoop.
flink-client1.15.1Scripts y aplicaciones de cliente de línea de comando de Apache Flink.
flink-jobmanager-config1.15.1Administración de recursos en nodos de EMR para JobManager de Apache Flink.
ganglia-monitor3.7.2Agente de Ganglia incrustado para aplicaciones del ecosistema de Hadoop junto con el agente de monitorización de Ganglia.
ganglia-metadata-collector3.7.2Recopilador de metadatos de Ganglia para agregación de métricas a partir de los agentes de monitorización de Ganglia.
ganglia-web3.7.1Aplicación web para visualizar las métricas recopiladas por el recopilador de metadatos de Ganglia.
hadoop-client3.2.1-amzn-8.1Los clientes de línea de comando de Hadoop como, por ejemplo "hdfs", "hadoop" o "yarn".
hadoop-hdfs-datanode3.2.1-amzn-8.1Servicio de nivel de nodos de HDFS para el almacenamiento de bloques.
hadoop-hdfs-library3.2.1-amzn-8.1Biblioteca y cliente de línea de comandos HDFS
hadoop-hdfs-namenode3.2.1-amzn-8.1Servicio de HDFS para realizar un seguimiento de nombres de archivo y bloquear ubicaciones.
hadoop-hdfs-journalnode3.2.1-amzn-8.1Servicio de HDFS para administrar los archivos de Hadoop periódico en clústeres de alta disponibilidad.
hadoop-httpfs-server3.2.1-amzn-8.1Punto de enlace HTTP para operaciones HDFS.
hadoop-kms-server3.2.1-amzn-8.1Servidor de administración de claves criptográficas basado en el API KeyProvider de Hadoop.
hadoop-mapred3.2.1-amzn-8.1Bibliotecas de motor de ejecución de MapReduce para ejecutar una aplicación de MapReduce.
hadoop-yarn-nodemanager3.2.1-amzn-8.1Servicio de YARN para la administración de contenedores en un nodo individual.
hadoop-yarn-resourcemanager3.2.1-amzn-8.1Servicio de YARN para la asignación y administración de recursos de clúster y aplicaciones distribuidas.
hadoop-yarn-timeline-server3.2.1-amzn-8.1Servicio para recuperar información actual e histórica para aplicaciones de YARN.
hbase-hmaster2.4.12-amzn-0.1Servicio para un clúster de HBase responsable de la coordinación de regiones y ejecución de comandos administrativos.
hbase-region-server2.4.12-amzn-0.1Servicio que atiende a una o varias regiones de HBase.
hbase-client2.4.12-amzn-0.1Cliente de línea de comando de HBase.
hbase-rest-server2.4.12-amzn-0.1Servicio que proporciona un punto de enlace HTTP RESTful para HBase.
hbase-thrift-server2.4.12-amzn-0.1Service que proporciona un punto de enlace de Thrift a HBase.
hbase-operator-tools2.4.12-amzn-0.1Herramienta de reparación para clústeres de Apache HBase.
hcatalog-client3.1.3-amzn-1.1El cliente de línea de comando "hcat" para manipular hcatalog-server.
hcatalog-server3.1.3-amzn-1.1Service que proporciona a HCatalog, una tabla y capa de administración de almacenamiento para aplicaciones distribuidas.
hcatalog-webhcat-server3.1.3-amzn-1.1Punto de enlace HTTP que proporciona una interfaz REST a HCatalog.
hive-client3.1.3-amzn-1.1Cliente de línea de comando de Hive.
hive-hbase3.1.3-amzn-1.1Hive-hbase client.
hive-metastore-server3.1.3-amzn-1.1Service para acceder al metaalmacén de Hive, un repositorio semántico que almacena metadatos para SQL en operaciones de Hadoop.
hive-server23.1.3-amzn-1.1Servicio para aceptar consultas de Hive como solicitudes web.
hudi0.11.1-amzn-0Marco de procesamiento incremental para impulsar la canalización de datos a baja latencia y alta eficiencia.
hudi-presto0.11.1-amzn-0Biblioteca de paquetes para ejecutar Presto con Hudi.
hudi-trino0.11.1-amzn-0Biblioteca de paquetes para ejecutar Trino con Hudi.
hudi-spark0.11.1-amzn-0Biblioteca de paquetes para ejecutar Spark con Hudi.
hue-server4.10.0Aplicación web para analizar datos con aplicaciones del ecosistema de Hadoop
iceberg0.14.0-amzn-0Apache Iceberg es un formato de tabla abierto para conjuntos de datos analíticos muy grandes
jupyterhub1.4.1Servidor multiusuario para blocs de notas Jupyter
livy-server0.7.1-incubatingInterfaz de REST para interactuar con Apache Spark
nginx1.12.1nginx [engine x] es un servidor HTTP y proxy inverso
mxnet1.9.1Una biblioteca flexible, escalable y eficiente para el aprendizaje profundo.
mariadb-server5.5.68+Servidor de base de datos de MariaDB.
nvidia-cuda11.7.0Controladores Nvidia y conjunto de herramientas Cuda
oozie-client5.2.1Cliente de línea de comando de Oozie.
oozie-server5.2.1Servicio para aceptar solicitudes de flujo de trabajo de Oozie.
opencv4.5.0Biblioteca de visión artificial de código abierto.
phoenix-library5.1.2Las bibliotecas de Phoenix para servidor y cliente
phoenix-connectors5.1.2Conectores de Apache Phoenix para Spark-3
phoenix-query-server5.1.2Un servidor ligero que proporciona acceso a JDBC, así como acceso de formato Protocol Buffers y JSON al API de Avatica
presto-coordinator0.273.3-amzn-0Servicio para aceptar las consultas y administrar la ejecución de consultas entre presto-workers.
presto-worker0.273.3-amzn-0Service para ejecutar partes de una consulta.
presto-client0.273.3-amzn-0Cliente de línea de comandos Presto que se instala en los nodos principales en espera de un clúster de HA donde el servidor Presto no se ha iniciado.
trino-coordinator388-amzn-0Servicio para aceptar consultas y administrar la ejecución de consultas entre trino-workers.
trino-worker388-amzn-0Service para ejecutar partes de una consulta.
trino-client388-amzn-0Cliente de línea de comandos Trino que se instala en los maestros en espera de un clúster de HA donde el servidor Trino no se ha iniciado.
pig-client0.17.0Cliente de línea de comando de Pig.
r4.0.2Proyecto R para análisis estadístico
ranger-kms-server2.0.0Sistema de administración de claves Apache Ranger
spark-client3.3.0-amzn-0.1Clientes de línea de comando de Spark.
spark-history-server3.3.0-amzn-0.1IU web para la visualización de eventos registrados durante la vida útil de una aplicación Spark completada.
spark-on-yarn3.3.0-amzn-0.1Motor de ejecución en memoria para YARN.
spark-yarn-slave3.3.0-amzn-0.1Bibliotecas de Apache Spark necesarias para esclavos de YARN.
spark-rapids22.06.0-amzn-0Complemento Nvidia Spark RAPIDS que acelera Apache Spark con GPU.
sqoop-client1.4.7Cliente de línea de comando de Apache Sqoop.
tensorflow2.9.1Biblioteca de software de código abierto de TensorFlow para cálculos numéricos de alto rendimiento.
tez-on-yarn0.9.2La aplicación YARN de tez y bibliotecas.
webserver2.4.41+Servidor HTTP de Apache.
zeppelin-server0.10.1Bloc de notas basado en web que permite el análisis de datos interactivo.
zookeeper-server3.5.10Servicio centralizado para mantener información de configuración, nomenclatura, proporcionar sincronización distribuida y proporcionar servicios de grupo.
zookeeper-client3.5.10Cliente de línea de comando de ZooKeeper.

Clasificaciones de configuración de la versión 6.8.1

Las clasificaciones de configuración le permiten personalizar las aplicaciones. Suelen corresponder a un archivo XML de configuración para la aplicación como, por ejemplo, hive-site.xml. Para obtener más información, consulte Configuración de aplicaciones.

Las acciones de reconfiguración se producen cuando se especifica una configuración para los grupos de instancias de un clúster en ejecución. Amazon EMR solo inicia acciones de reconfiguración para las clasificaciones que se modifican. Para obtener más información, consulte Reconfiguración de un grupo de instancias en un clúster en ejecución.

Clasificaciones de emr-6.8.1
Clasificaciones Descripción Acciones de reconfiguración

capacity-scheduler

Cambiar los valores en el archivo capacity-scheduler.xml de Hadoop.

Restarts the ResourceManager service.

container-executor

Cambie los valores en el archivo container-executor.cfg de Hadoop YARN.

Not available.

container-log4j

Cambiar los valores en el archivo container-log4j.properties de Hadoop YARN.

Not available.

core-site

Cambiar los valores en el archivo core-site.xml de Hadoop.

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Ranger KMS, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

docker-conf

Cambie la configuración relacionada con el docker.

Not available.

emrfs-site

Cambiar la configuración de EMRFS.

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts HBaseRegionserver, HBaseMaster, HBaseThrift, HBaseRest, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

flink-conf

Cambiar la configuración de flink-conf.yaml.

Restarts Flink history server.

flink-log4j

Cambiar la configuración de log4j.properties de Flink.

Restarts Flink history server.

flink-log4j-session

Cambie la configuración de log4j-session.properties de Flink para sesión de Kubernetes o Yarn.

Restarts Flink history server.

flink-log4j-cli

Cambiar la configuración de log4j-cli.properties de Flink.

Restarts Flink history server.

hadoop-env

Cambiar los valores en el entorno de Hadoop para todos los componentes de Hadoop.

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts PhoenixQueryserver, HiveServer2, Hive MetaStore, and MapReduce-HistoryServer.

hadoop-log4j

Cambiar los valores en el archivo log4j.properties de Hadoop.

Restarts the Hadoop HDFS services SecondaryNamenode, Datanode, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Hadoop Httpfs, and MapReduce-HistoryServer.

hadoop-ssl-server

Cambiar la configuración del servidor ssl de Hadoop

Not available.

hadoop-ssl-client

Cambiar la configuración del cliente ssl de Hadoop

Not available.

hbase

Configuración de Amazon EMR mantenida para Apache HBase.

Custom EMR specific property. Sets emrfs-site and hbase-site configs. See those for their associated restarts.

hbase-env

Cambiar los valores en el entorno de HBase.

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-log4j

Cambiar los valores en el archivo hbase-log4j.properties de HBase.

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-metrics

Cambiar los valores en el archivo hadoop-metrics2-hbase.properties de HBase.

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-policy

Cambiar los valores en el archivo hbase-policy.xml de HBase.

Not available.

hbase-site

Cambiar los valores en el archivo hbase-site.xml de HBase.

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. Additionally restarts Phoenix QueryServer.

hdfs-encryption-zones

Configurar zonas de cifrado de HDFS.

This classification should not be reconfigured.

hdfs-env

Cambiar los valores en el entorno de HDFS.

Restarts Hadoop HDFS services Namenode, Datanode, and ZKFC.

hdfs-site

Cambiar los valores en hdfs-site.xml de HDFS.

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Additionally restarts Hadoop Httpfs.

hcatalog-env

Cambiar los valores en el entorno de HCatalog.

Restarts Hive HCatalog Server.

hcatalog-server-jndi

Cambiar los valores en jndi.properties de HCatalog.

Restarts Hive HCatalog Server.

hcatalog-server-proto-hive-site

Cambiar los valores en proto-hive-site.xml de HCatalog.

Restarts Hive HCatalog Server.

hcatalog-webhcat-env

Cambiar los valores en el entorno de HCatalog WebHCat.

Restarts Hive WebHCat server.

hcatalog-webhcat-log4j2

Cambiar los valores en log4j2.properties de HCatalog WebHCat.

Restarts Hive WebHCat server.

hcatalog-webhcat-site

Cambiar los valores en el archivo webhcat-site.xml de HCatalog WebHCat.

Restarts Hive WebHCat server.

hive

Configuración de Amazon EMR mantenida para Apache Hive.

Sets configurations to launch Hive LLAP service.

hive-beeline-log4j2

Cambiar los valores en el archivo beeline-log4j2.properties de Hive.

Not available.

hive-parquet-logging

Cambiar los valores en el archivo parquet-logging.properties de Hive.

Not available.

hive-env

Cambiar los valores en el entorno de Hive.

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore.

hive-exec-log4j2

Cambiar los valores en el archivo hive-exec-log4j2.properties de Hive.

Not available.

hive-llap-daemon-log4j2

Cambiar los valores en el archivo llap-daemon-log4j2.properties de Hive.

Not available.

hive-log4j2

Cambiar los valores en el archivo hive-log4j2.properties de Hive.

Not available.

hive-site

Cambiar los valores en el archivo hive-site.xml de Hive.

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore. Also restarts Oozie and Zeppelin.

hiveserver2-site

Cambiar los valores en el archivo hiveserver2-site.xml de Hive Server2.

Not available.

hue-ini

Cambiar los valores en el archivo ini de Hue

Restarts Hue. Also activates Hue config override CLI commands to pick up new configurations.

httpfs-env

Cambiar los valores en el entorno de HTTPFS.

Restarts Hadoop Httpfs service.

httpfs-site

Cambiar los valores en el archivo httpfs-site.xml de Hadoop.

Restarts Hadoop Httpfs service.

hadoop-kms-acls

Cambiar los valores en el archivo kms-acls.xml de Hadoop.

Not available.

hadoop-kms-env

Cambiar los valores en el entorno de Hadoop KMS.

Restarts Hadoop-KMS service.

hadoop-kms-log4j

Cambiar los valores en el archivo kms-log4j.properties de Hadoop.

Not available.

hadoop-kms-site

Cambiar los valores en el archivo kms-site.xml de Hadoop.

Restarts Hadoop-KMS and Ranger-KMS service.

hudi-env

Cambiar los valores en el entorno de Hudi.

Not available.

hudi-defaults

Cambie los valores en el archivo hudi-defaults.conf de Hudi.

Not available.

iceberg-defaults

Cambie los valores del archivo iceberg-defaults.conf de Iceberg.

Not available.

jupyter-notebook-conf

Cambiar los valores en el archivo jupyter_notebook_config.py de Jupyter Notebook.

Not available.

jupyter-hub-conf

Cambiar los valores en el archivo jupyterhub_config.py de JupyterHubs.

Not available.

jupyter-s3-conf

Configurar la persistencia en S3 del bloc de notas de Jupyter.

Not available.

jupyter-sparkmagic-conf

Cambiar los valores en el archivo config.json de Sparkmagic.

Not available.

livy-conf

Cambiar los valores en el archivo livy.conf de Livy.

Restarts Livy Server.

livy-env

Cambiar los valores en el entorno de Livy.

Restarts Livy Server.

livy-log4j

Cambiar la configuración de log4j.properties de Livy.

Restarts Livy Server.

mapred-env

Cambiar los valores en el entorno de aplicación de MapReduce.

Restarts Hadoop MapReduce-HistoryServer.

mapred-site

Cambiar los valores en el archivo mapred-site.xml de la aplicación MapReduce.

Restarts Hadoop MapReduce-HistoryServer.

oozie-env

Cambiar los valores en el entorno de Oozie.

Restarts Oozie.

oozie-log4j

Cambiar los valores en el archivo oozie-log4j.properties de Oozie.

Restarts Oozie.

oozie-site

Cambiar los valores en el archivo oozie-site.xml de Oozie.

Restarts Oozie.

phoenix-hbase-metrics

Cambiar los valores en el archivo hadoop-metrics2-hbase.properties de Phoenix.

Not available.

phoenix-hbase-site

Cambiar los valores en el archivo hbase-site.xml de Phoenix.

Not available.

phoenix-log4j

Cambiar los valores en el archivo log4j.properties de Phoenix.

Restarts Phoenix-QueryServer.

phoenix-metrics

Cambiar los valores en el archivo hadoop-metrics2-phoenix.properties de Phoenix.

Not available.

pig-env

Cambiar los valores en el entorno de Pig.

Not available.

pig-properties

Cambiar los valores en el archivo pig.properties de Pig.

Restarts Oozie.

pig-log4j

Cambiar los valores en el archivo log4j.properties de Pig.

Not available.

presto-log

Cambiar los valores en el archivo log.properties de Presto.

Restarts Presto-Server (for PrestoDB)

presto-config

Cambiar los valores en el archivo config.properties de Presto.

Restarts Presto-Server (for PrestoDB)

presto-password-authenticator

Cambiar los valores en el archivo password-authenticator.properties de Presto.

Not available.

presto-env

Cambiar valores en el archivo presto-env.sh de Presto.

Restarts Presto-Server (for PrestoDB)

presto-node

Cambiar valores en el archivo node.properties de Presto.

Not available.

presto-connector-blackhole

Cambiar los valores en el archivo blackhole.properties de Presto.

Not available.

presto-connector-cassandra

Cambiar los valores en el archivo cassandra.properties de Presto.

Not available.

presto-connector-hive

Cambiar los valores en el archivo hive.properties de Presto.

Restarts Presto-Server (for PrestoDB)

presto-connector-jmx

Cambiar los valores en el archivo jmx.properties de Presto.

Not available.

presto-connector-kafka

Cambiar los valores en el archivo kafka.properties de Presto.

Not available.

presto-connector-localfile

Cambiar los valores en el archivo localfile.properties de Presto.

Not available.

presto-connector-memory

Cambiar los valores del archivo memory.properties de Presto.

Not available.

presto-connector-mongodb

Cambiar los valores en el archivo mongodb.properties de Presto.

Not available.

presto-connector-mysql

Cambiar los valores en el archivo mysql.properties de Presto.

Not available.

presto-connector-postgresql

Cambiar los valores en el archivo postgresql.properties de Presto.

Not available.

presto-connector-raptor

Cambiar los valores en el archivo raptor.properties de Presto.

Not available.

presto-connector-redis

Cambiar los valores en el archivo redis.properties de Presto.

Not available.

presto-connector-redshift

Cambiar los valores en el archivo redshift.properties de Presto.

Not available.

presto-connector-tpch

Cambiar los valores en el archivo tpch.properties de Presto.

Not available.

presto-connector-tpcds

Cambiar los valores del archivo tpcds.properties de Presto.

Not available.

trino-log

Cambiar los valores en el archivo log.properties de Trino.

Restarts Trino-Server (for Trino)

trino-config

Cambiar los valores en el archivo config.properties de Trino.

Restarts Trino-Server (for Trino)

trino-password-authenticator

Cambiar los valores en el archivo password-authenticator.properties de Trino.

Restarts Trino-Server (for Trino)

trino-env

Cambie los valores del archivo trino-env.sh de Trino.

Restarts Trino-Server (for Trino)

trino-node

Cambiar los valores en el archivo node.properties de Trino.

Not available.

trino-connector-blackhole

Cambiar los valores en el archivo blackhole.properties de Trino.

Not available.

trino-connector-cassandra

Cambiar los valores en el archivo cassandra.properties de Trino.

Not available.

trino-connector-hive

Cambiar los valores en el archivo hive.properties de Trino.

Restarts Trino-Server (for Trino)

trino-connector-iceberg

Cambiar los valores en el archivo iceberg.properties de Trino.

Restarts Trino-Server (for Trino)

trino-connector-jmx

Cambiar los valores en el archivo jmx.properties de Trino.

Not available.

trino-connector-kafka

Cambiar los valores en el archivo kafka.properties de Trino.

Not available.

trino-connector-localfile

Cambiar los valores en el archivo localfile.properties de Trino.

Not available.

trino-connector-memory

Cambiar los valores en el archivo memory.properties de Trino.

Not available.

trino-connector-mongodb

Cambiar los valores en el archivo mongodb.properties de Trino.

Not available.

trino-connector-mysql

Cambiar los valores en el archivo mysql.properties de Trino.

Not available.

trino-connector-postgresql

Cambiar los valores en el archivo postgresql.properties de Trino.

Not available.

trino-connector-raptor

Cambiar los valores en el archivo raptor.properties de Trino.

Not available.

trino-connector-redis

Cambiar los valores en el archivo redis.properties de Trino.

Not available.

trino-connector-redshift

Cambiar los valores en el archivo redshift.properties de Trino.

Not available.

trino-connector-tpch

Cambiar los valores en el archivo tpch.properties de Trino.

Not available.

trino-connector-tpcds

Cambiar los valores en el archivo tpcds.properties de Trino.

Not available.

ranger-kms-dbks-site

Cambie los valores del archivo dbks-site.xml de Ranger KMS.

Restarts Ranger KMS Server.

ranger-kms-site

Cambie los valores del archivo ranger-kms-site.xml de Ranger KMS.

Restarts Ranger KMS Server.

ranger-kms-env

Cambie los valores del entorno Ranger KMS.

Restarts Ranger KMS Server.

ranger-kms-log4j

Cambie los valores del archivo kms-log4j.properties de Ranger KMS.

Not available.

ranger-kms-db-ca

Cambie los valores del archivo CA en S3 para la conexión SSL de MySQL con Ranger KMS.

Not available.

spark

Configuración de Amazon EMR mantenida para Apache Spark.

This property modifies spark-defaults. See actions there.

spark-defaults

Cambiar los valores en el archivo spark-defaults.conf de Spark.

Restarts Spark history server and Spark thrift server.

spark-env

Cambiar los valores en el entorno de Spark.

Restarts Spark history server and Spark thrift server.

spark-hive-site

Cambiar los valores en el archivo hive-site.xml de Spark.

Not available.

spark-log4j2

Cambiar los valores en el archivo log4j2.properties de Spark.

Restarts Spark history server and Spark thrift server.

spark-metrics

Cambiar los valores en el archivo metrics.properties de Spark.

Restarts Spark history server and Spark thrift server.

sqoop-env

Cambiar los valores en el entorno de Sqoop.

Not available.

sqoop-oraoop-site

Cambiar los valores en el archivo oraoop-site.xml de Sqoop OraOop.

Not available.

sqoop-site

Cambiar los valores en el archivo sqoop-site.xml de Sqoop.

Not available.

tez-site

Cambiar los valores en el archivo tez-site.xml de Tez.

Restart Oozie and HiveServer2.

yarn-env

Cambiar los valores en el entorno de YARN.

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts MapReduce-HistoryServer.

yarn-site

Cambiar los valores en el archivo yarn-site.xml de YARN.

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Livy Server and MapReduce-HistoryServer.

zeppelin-env

Cambiar los valores en el entorno de Zeppelin.

Restarts Zeppelin.

zeppelin-site

Cambie los ajustes de configuración de zeppelin-site.xml.

Restarts Zeppelin.

zookeeper-config

Cambiar los valores del archivo zoo.cfg de ZooKeeper.

Restarts Zookeeper server.

zookeeper-log4j

Cambiar los valores en el archivo log4j.properties de ZooKeeper.

Restarts Zookeeper server.

Registro de cambios de la versión 6.8.1

Registro de cambios de la versión 6.8.1 y notas de la versión
Date Evento Descripción
2023-08-30 Actualización de las notas de la versión Se han agregado varias correcciones relacionadas con el plano de control a las notas de la versión
2023-08-21 Publicación de documentos Las notas de la versión 6.8.1 de Amazon EMR se publicaron por primera vez
2023-08-16 Implementación completa Amazon EMR 6.8.1 se ha implementado completamente en todas las regiones compatibles
2023-08-04 Versión inicial Amazon EMR 6.8.1 se implementó por primera vez en regiones comerciales limitadas