Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Gunakan AWS Glue versi terbaru
Kami merekomendasikan menggunakan AWS Glue versi terbaru. Ada beberapa pengoptimalan dan peningkatan yang dibangun ke dalam setiap versi yang mungkin secara otomatis meningkatkan kinerja pekerjaan. Misalnya, AWS Glue 4.0 menyediakan fitur-fitur baru berikut:
-
Runtime Apache Spark 3.3.0 baru yang dioptimalkan — AWS Glue 4.0 dibangun di atas runtime Apache Spark 3.3.0, menghadirkan peningkatan kinerja yang sebanding dengan Spark open source. Runtime Spark 3.3.0 dibangun di atas banyak inovasi dari Spark 2.x.
-
Konektor Amazon Redshift yang disempurnakan - versi AWS Glue 4.0 dan yang lebih baru menyediakan integrasi Amazon Redshift untuk Apache Spark. Integrasi dibangun di atas konektor open source yang ada dan meningkatkannya untuk kinerja dan keamanan. Integrasi ini membantu aplikasi bekerja hingga 10 kali lebih cepat. Untuk informasi lebih lanjut, lihat posting blog tentang integrasi Amazon Redshift dengan Apache
Spark. -
SIMDeksekusi berbasis untuk pembacaan vektor dengan CSV dan JSON data — AWS Glue versi 3.0 dan versi yang lebih baru menambahkan pembaca yang dioptimalkan yang secara signifikan dapat mempercepat kinerja pekerjaan secara keseluruhan dibandingkan dengan pembaca berbasis baris. Untuk informasi selengkapnya tentang CSV data, lihat Mengoptimalkan kinerja baca dengan pembaca vektor SIMD CSV. Untuk informasi selengkapnya tentang JSON data, lihat Menggunakan SIMD JSON pembaca vektor dengan format kolom Apache Arrow.
Setiap AWS Glue versi akan menyertakan upgrade semacam ini, di antara banyak, termasuk konektor, driver dan pembaruan perpustakaan. Untuk informasi selengkapnya, lihat AWS Glue versi dan Memigrasi AWS Glue pekerjaan ke AWS Glue versi 4.0.