Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengevaluasi kualitas data dengan AWS Glue Studio
AWS GlueKualitas Data mengevaluasi dan memantau kualitas data Anda berdasarkan aturan yang Anda tetapkan. Ini memudahkan untuk mengidentifikasi data yang membutuhkan tindakan. DiAWS Glue Studio, Anda dapat menambahkan node kualitas data ke pekerjaan visual Anda untuk membuat aturan kualitas data pada tabel di Katalog Data Anda. Anda kemudian dapat memantau dan mengevaluasi perubahan pada kumpulan data Anda saat mereka berkembang dari waktu ke waktu. Untuk ikhtisar tentang cara bekerja dengan Kualitas AWS Glue Data diAWS Glue Studio, lihat video berikut.
Berikut ini adalah langkah-langkah tingkat tinggi untuk bagaimana Anda bekerja dengan Kualitas AWS Glue Data:
-
Buat aturan kualitas data — Buat seperangkat aturan kualitas data menggunakan DQDL pembuat dengan memilih kumpulan aturan bawaan yang Anda konfigurasikan.
-
Konfigurasikan pekerjaan kualitas data - Tentukan tindakan berdasarkan hasil kualitas data dan opsi keluaran.
-
Simpan dan jalankan pekerjaan berkualitas data — Buat dan jalankan pekerjaan. Menyimpan pekerjaan akan menyimpan aturan yang Anda buat untuk pekerjaan itu.
-
Pantau dan tinjau hasil kualitas data — Tinjau hasil kualitas data setelah pekerjaan selesai. Secara opsional, jadwalkan pekerjaan untuk kencan masa depan.
Manfaat
Analis data, insinyur data, dan ilmuwan data dapat menggunakan node Evaluate Data Quality AWS Glue Studio untuk menganalisis, mengkonfigurasi, memantau, dan meningkatkan kualitas data dari editor pekerjaan visual. Manfaat menggunakan node kualitas data antara lain sebagai berikut:
-
Anda dapat mendeteksi masalah kualitas data - Anda dapat memeriksa masalah dengan membuat aturan yang memeriksa karakteristik kumpulan data Anda.
-
Sangat mudah untuk memulai - Anda dapat mulai dengan aturan dan tindakan yang telah dibuat sebelumnya.
-
Integrasi ketat - Anda dapat menggunakan node kualitas AWS Glue data AWS Glue Studio karena Kualitas Data berjalan di atas Katalog AWS Glue Data.