EMR Serverless 6.9.0 - Amazon EMR

EMR Serverless 6.9.0

En la siguiente tabla se enumeran las versiones de la aplicación que están disponibles con la versión EMR Serverless 6.9.0.

Aplicación Versión
Apache Spark 3.3.0
Apache Hive 3.1.3
Apache Tez 0.10.2
Notas de la versión 6.9.0 de EMR sin servidor
  • La integración de Amazon Redshift para Apache Spark se incluye en las versiones 6.9.0 y posteriores de Amazon EMR. La integración nativa, que anteriormente era una herramienta de código abierto, es un conector de Spark que puede utilizar para crear aplicaciones de Apache Spark que leen y escriben datos en Amazon Redshift y Amazon Redshift sin servidor. Para obtener más información, consulte Uso de la integración de Amazon Redshift para Apache Spark en Amazon EMR sin servidor.

  • La versión 6.9.0 de EMR sin servidor agrega compatibilidad con la arquitectura AWS Graviton2 (arm64). Puede usar el parámetro architecture para las API create-application y update-application para elegir la arquitectura arm64. Para obtener más información, consulte Opciones de la arquitectura de Amazon EMR sin servidor.

  • Ahora puede exportar, importar, consultar y unir tablas de Amazon DynamoDB directamente desde sus aplicaciones EMR sin servidor Spark y Hive. Para obtener más información, consulte Conexión a DynamoDB con Amazon EMR sin servidor.

Problemas conocidos

  • Si utiliza la integración de Amazon Redshift para Apache Spark y tiene un valor de time, timetz, timestamp o timestamptz con una precisión de microsegundos en formato Parquet, el conector redondea los valores de tiempo al valor de milisegundos más cercano. Como solución alternativa, utilice el parámetro unload_s3_format de formato de descarga de texto.