Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Apache Hudi
Hudi terintegrasi dengan Apache percikan
Dengan Amazon EMR versi rilis 5.28.0 dan yang lebih baru, EMR menginstal komponen Hudi secara default ketika Spark, Hive, Presto, atau Flink diinstal. Anda dapat menggunakan Spark atau DeltaStreamer utilitas Hudi untuk membuat atau memperbarui kumpulan data Hudi. Anda dapat menggunakan Hive, Spark, Presto, atau Flink untuk menanyakan dataset Hudi secara interaktif atau membangun pipeline pemrosesan data menggunakan incremental pull. Tarikan tambahan mengacu pada kemampuan untuk hanya menarik data yang berubah antara dua tindakan.
Fitur-fitur ini membuat Hudi cocok untuk kasus penggunaan berikut:
-
Bekerja dengan data streaming dari sensor dan perangkat Internet untuk Segala (IoT) lainnya yang memerlukan penyisipan data dan pembaruan peristiwa tertentu.
-
Mematuhi peraturan privasi data dalam aplikasi di mana pengguna mungkin memilih untuk dilupakan atau mengubah persetujuan tentang bagaimana data mereka dapat digunakan.
-
Menerapkan ubah sistem penangkapan data (CDC)
yang memungkinkan Anda untuk menerapkan perubahan pada set data dari waktu ke waktu.
Tabel berikut mencantumkan versi Hudi yang termasuk dalam rilis terbaru seri Amazon EMR 7.x, bersama dengan komponen yang dipasang Amazon EMR dengan Hudi.
Untuk versi komponen yang diinstal dengan Hudi dalam rilis ini, lihat Rilis 7.8.0 Versi Komponen.
Label Rilis Amazon EMR | Versi Hudi | Komponen Dipasang Dengan Hudi |
---|---|---|
emr-7.8.0 |
Hudi 0.15.0-amzn-5 |
Not available. |
Tabel berikut mencantumkan versi Hudi yang termasuk dalam rilis terbaru seri Amazon EMR 6.x, bersama dengan komponen yang dipasang Amazon EMR dengan Hudi.
Untuk versi komponen yang diinstal dengan Hudi dalam rilis ini, lihat Rilis Versi Komponen 6.15.0.
Label Rilis Amazon EMR | Versi Hudi | Komponen Dipasang Dengan Hudi |
---|---|---|
emr-6.15.0 |
Hudi 0.14.0-amzn-0 |
Not available. |
catatan
Amazon EMR rilis 6.8.0 hadir dengan Apache Hudi 0.11.1hudi-spark3.3-bundle_2.12
Tabel berikut mencantumkan versi Hudi yang termasuk dalam rilis terbaru seri Amazon EMR 5.x, bersama dengan komponen yang dipasang Amazon EMR dengan Hudi.
Untuk versi komponen yang diinstal dengan Hudi dalam rilis ini, lihat Rilis 5.36.2 Versi Komponen.
Label Rilis Amazon EMR | Versi Hudi | Komponen Dipasang Dengan Hudi |
---|---|---|
emr-5.36.2 |
Hudi 0.10.1-amzn-1 |
Not available. |