Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Utilice la última versión AWS Glue
Recomendamos utilizar la AWS Glue versión más reciente. Hay varias optimizaciones y actualizaciones integradas en cada versión que pueden mejorar automáticamente el rendimiento laboral. Por ejemplo, la AWS Glue versión 4.0 ofrece las siguientes funciones nuevas:
-
Nuevo entorno de ejecución optimizado de Apache Spark 3.3.0: la AWS Glue versión 4.0 se basa en el entorno de ejecución de Apache Spark 3.3.0 y ofrece mejoras de rendimiento comparables a las de Spark de código abierto. El tiempo de ejecución de Spark 3.3.0 se basa en muchas de las innovaciones de Spark 2.x.
-
Conector Amazon Redshift mejorado: las versiones AWS Glue 4.0 y posteriores proporcionan la integración de Amazon Redshift para Apache Spark. La integración se basa en un conector de código abierto existente y lo mejora en términos de rendimiento y seguridad. La integración ayuda a que las aplicaciones funcionen hasta 10 veces más rápido. Para obtener más información, consulte la entrada del blog sobre la integración de Amazon Redshift con Apache Spark
. -
SIMDejecución basada en lecturas vectorizadas con JSON datos CSV y lecturas: la AWS Glue versión 3.0 y las versiones posteriores incorporan lectores optimizados que pueden acelerar considerablemente el rendimiento general del trabajo en comparación con los lectores basados en filas. Para obtener más información sobre CSV los datos, consulte Optimizar el rendimiento de lectura con un lector vectorizado. SIMD CSV Para obtener más información sobre JSON los datos, consulte Uso de un SIMD JSON lector vectorizado con el formato de columnas Apache Arrow.
Cada AWS Glue versión incluirá actualizaciones de este tipo, entre otras muchas, como actualizaciones de conectores, controladores y bibliotecas. Para obtener más información, consulte AWS Glue Versiones y Migración de AWS Glue trabajos a la AWS Glue versión 4.0.