Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Usa la versione più recente AWS Glue
Ti consigliamo di utilizzare la versione più recente AWS Glue . In ogni versione sono presenti diverse ottimizzazioni e aggiornamenti che potrebbero migliorare automaticamente le prestazioni lavorative. Ad esempio, AWS Glue 4.0 offre le seguenti nuove funzionalità:
-
Il nuovo runtime ottimizzato di Apache Spark 3.3.0 — AWS Glue 4.0 si basa sul runtime Apache Spark 3.3.0 e offre miglioramenti prestazionali comparabili a quelli di Spark open source. Il runtime Spark 3.3.0 si basa su molte delle innovazioni di Spark 2.x.
-
Connettore Amazon Redshift avanzato: AWS Glue 4.0 e versioni successive forniscono l'integrazione di Amazon Redshift per Apache Spark. L'integrazione si basa su un connettore open source esistente e lo migliora in termini di prestazioni e sicurezza. L'integrazione aiuta le applicazioni a prestazioni fino a 10 volte più veloci. Per ulteriori informazioni, consulta il post di blog sull'integrazione di Amazon Redshift con Apache
Spark. -
SIMDesecuzione basata per letture vettoriali con JSON dati CSV e dati: la AWS Glue versione 3.0 e le versioni successive aggiungono lettori ottimizzati che possono velocizzare notevolmente le prestazioni lavorative complessive rispetto ai lettori basati su righe. Per ulteriori informazioni sui CSV dati, consulta Ottimizzare le prestazioni di lettura con un lettore vettoriale. SIMD CSV Per ulteriori informazioni sui JSON dati, consulta Utilizzo del SIMD JSON lettore vettoriale con il formato colonnare Apache Arrow.
Ogni AWS Glue versione includerà aggiornamenti di questo tipo, tra i tanti, tra cui connettori, aggiornamenti di driver e librerie. Per ulteriori informazioni, consulta AWS Glue Versioni e migrazione dei AWS Glue lavori alla AWS Glue versione 4.0.