AWS Glue DataBrew - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AWS Glue DataBrew

AWS Glue DataBrew adalah layanan persiapan data visual yang dikelola sepenuhnya untuk membersihkan, menormalkan, dan mengubah data. Ini berbeda dari AWS Glue ETL karena Anda tidak memiliki kode tulis untuk bekerja dengannya. DataBrew menyediakan lebih dari 250 transformasi bawaan, dengan point-and-click antarmuka visual untuk membuat dan mengelola pekerjaan transformasi data.

DataBrew tersedia dalam tampilan konsol terpisah dari AWS Glue. Ini terintegrasi secara native dengan beberapa AWS layanan dan mendukung banyak format file yang berbeda. Untuk informasi selengkapnya, lihat Integrasi produk dan layanan.

DataBrew didasarkan pada enam konsep inti berikut:

  • Proyek — Seluruh ruang kerja persiapan data di DataBrew

  • Dataset — Kumpulan data terstruktur atau semi-terstruktur

  • Resep — Satu set langkah transformasi data; setiap langkah dapat berisi banyak tindakan

  • Job — Satu set instruksi untuk menjalankan resep atau pekerjaan profil data 

  • Silsilah data — Pelacakan data dalam antarmuka visual untuk mengidentifikasi asal-usulnya

  • Profil data — Tampilan ringkasan dari bentuk data Anda

AWS Glue DataBrew terintegrasi dengan AWS Glue Studio, sehingga Anda dapat mengatur DataBrew resep dalam pekerjaan dan alur kerja AWS Glue ETL Anda. DataBrew resep juga dapat memanfaatkan AWS Glue fitur seperti bookmark pekerjaan, percobaan ulang otomatis, dan penskalaan otomatis. Untuk memulai DataBrew, gunakan AWS Glue DataBrew contoh tutorial proyek.