Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Amazon EMR 6.9.0: notas de la versión de Hive - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon EMR 6.9.0: notas de la versión de Hive

Amazon EMR 6.9.0: cambios en Hive

Tipo Descripción
Upgrade Actualización de Jetty a 9.4.48.v20220622
Upgrade Compatibilidad con Hadoop 3.3.3
Característica Integración de Amazon EMR Hive con Lake Formation para cargas de trabajo interactivas mediante la API de GCSC.
Característica Integración de Amazon EMR Hive con Iceberg.
Mejora Active SSL en HiveServer 2 cuando el cifrado en tránsito esté habilitado mediante las configuraciones de seguridad de Amazon EMR.
Mejora Habilite el confirmador optimizado de Hive EMRFS de Amazon S3 de forma predeterminada. Para obtener más información, consulte Habilitación del confirmador optimizado Hive EMRFS S3.
Mejora Agregue HiveHBaseTableInputFormatV2 que hereda solo la versión mapeada de para corregir el SPARK-34210 InputFormat . Configure hive.hbase.inputformat.v2 en true para usarlo.
Mejoras Espere a que TezAM se inicie en segundo plano con hive.cli.tez.session.async en lugar de cerrarlo y lanzar uno nuevo inmediatamente. Use hive.emr.cli.tez.session.open.timeout para configurar este tiempo de espera en segundos.
Mejoras Agregue la opción hive.conf.restricted.list.append para anexar configuraciones separadas por comas a la lista hive.conf.restricted.list de configuraciones restringidas existente.
Mejoras Se muestra un mensaje de error más claro cuando se produce un error en la consulta de Hive porque la ubicación de la base de datos no está definida.
Portabilidad con versiones anteriores HIVE-24484: actualización de Hadoop a 3.3.1 y Tez a 0.10.2
Portabilidad con versiones anteriores HIVE-22398: Elimine la gestión de colas de YARN mediante. ShimLoader
Portabilidad con versiones anteriores HIVE-23190: LLAP: modificar para pasar un objeto del sistema de archivos a. IndexCache TezSpillRecord
Portabilidad con versiones anteriores HIVE-22185: El HADOOP-15832 provocará problemas con las pruebas que utilicen clústeres. MiniYarn
Portabilidad con versiones anteriores HIVE-21670: sustitución de mockito-all por la dependencia de mockito-core.
Portabilidad con versiones anteriores HIVE-24542: preparación de Guava para las actualizaciones.
Portabilidad con versiones anteriores HIVE-23751:: Reemplace el método para alinearlo después del HADOOP-16582. QTest #mkdirs() ProxyFileSystem
Portabilidad con versiones anteriores HIVE-21603: preparación de Java 11: actualización de la versión powermock.
Portabilidad con versiones anteriores HIVE-24083: error de hcatalog en Hadoop 3.3.0: se necesita un tipo de autenticación.
Portabilidad con versiones anteriores HIVE-24282: muestra que las columnas no deben ordenar las columnas de salida a menos que se mencione explícitamente.
Portabilidad con versiones anteriores HIVE-20656: valores predeterminados razonables: las configuraciones de memoria de agregación de asignaciones son demasiado agresivas.
Portabilidad con versiones anteriores HIVE-25443: Arrow SerDe no puede serializar/deserializar tipos de datos complejos cuando hay más de 1024 valores
Portabilidad con versiones anteriores HIVE-19792: actualización de ORC a 1.5.2 y habilitación de pruebas de evolución del esquema decimal_64.
Portabilidad con versiones anteriores HIVE-20437: gestión de la evolución del esquema a partir de valores flotantes, dobles y decimales.
Portabilidad con versiones anteriores HIVE-21987: Hive no puede leer el int32 de Parquet anotado con decimales.
Portabilidad con versiones anteriores HIVE-20038: las consultas de actualización en tablas no agrupadas y particionadas generan un NPE.

Amazon EMR 6.9.0: problemas conocidos de Hive

  • Con las versiones 6.6.0 a 6.9.x de Amazon EMR, las consultas INSERT con partición dinámica y una cláusula ORDER BY o SORT BY siempre tendrán dos reductores. Este problema se debe al cambio HIVE-20703 de OSS, que sitúa la optimización de la clasificación dinámica de las particiones en una decisión basada en los costos. Si su carga de trabajo no requiere ordenar las particiones dinámicas, le recomendamos que establezca la propiedad hive.optimize.sort.dynamic.partition.threshold en -1 para deshabilitar la nueva característica y obtener el número de reductores calculado correctamente. Este problema se ha corregido en OSS Hive como parte de HIVE-22269 y se ha corregido en Amazon EMR 6.10.0.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.