Utilisez la dernière AWS Glue version -

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisez la dernière AWS Glue version

Nous vous recommandons d'utiliser la dernière AWS Glue version. Plusieurs optimisations et mises à niveau intégrées à chaque version peuvent automatiquement améliorer les performances au travail. Par exemple, la AWS Glue version 4.0 fournit les nouvelles fonctionnalités suivantes :

  • Le nouveau moteur d'exécution Apache Spark 3.3.0 — AWS Glue 4.0 s'appuie sur le moteur d'exécution Apache Spark 3.3.0, apportant des améliorations de performances comparables à celles de Spark open source. Le runtime Spark 3.3.0 s'appuie sur de nombreuses innovations de Spark 2.x.

  • Connecteur Amazon Redshift amélioré : les versions AWS Glue 4.0 et ultérieures permettent l'intégration d'Amazon Redshift à Apache Spark. L'intégration s'appuie sur un connecteur open source existant et l'améliore en termes de performances et de sécurité. L'intégration permet aux applications de fonctionner jusqu'à 10 fois plus rapidement. Pour plus d'informations, consultez le billet de blog sur l'intégration d'Amazon Redshift à Apache Spark.

  • SIMDexécution basée sur des lectures vectorisées avec JSON des données : la AWS Glue version 3.0 CSV et les versions ultérieures ajoutent des lecteurs optimisés qui peuvent considérablement accélérer les performances globales du travail par rapport aux lecteurs basés sur des lignes. Pour plus d'informations sur les CSV données, voir Optimiser les performances de lecture avec un lecteur vectorisé. SIMD CSV Pour plus d'informations sur les JSON données, voir Utilisation d'un SIMD JSON lecteur vectorisé avec le format de colonne Apache Arrow.

Chaque AWS Glue version inclura des mises à niveau de ce type, entre autres, notamment des mises à jour de connecteurs, de pilotes et de bibliothèques. Pour plus d'informations, consultez AWS Glue les sections versions et Migration des AWS Glue tâches vers la AWS Glue version 4.0.