Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pengantar Danau Delta
Delta Lake adalah proyek sumber terbuka yang membantu mengimplementasikan arsitektur data lake modern yang biasanya dibangun di Amazon S3. Delta Lake menawarkan kemampuan berikut:
-
Transaksi atom, konsisten, terisolasi, tahan lama (ACID) di Spark. Pembaca melihat tampilan tabel yang konsisten selama pekerjaan Spark.
-
Penanganan metadata yang dapat diskalakan dengan pemrosesan terdistribusi oleh Spark.
-
Menggabungkan kasus penggunaan streaming dan batch dengan tabel Delta yang sama.
-
Penegakan skema otomatis untuk menghindari catatan buruk selama konsumsi data.
-
Perjalanan waktu dengan versi data.
-
Mendukung operasi penggabungan, pembaruan, dan penghapusan untuk kasus penggunaan yang kompleks seperti change data capture (CDC), streaming upserts, dan banyak lagi.