Mengisi Katalog AWS Glue Data - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengisi Katalog AWS Glue Data

Anda dapat mengisi AWS Glue Data Catalog menggunakan metode berikut:

  • Perayap AWS Glue — An Perayap AWS Glue dapat secara otomatis menemukan dan membuat katalog sumber data seperti database, data lake, dan streaming data. Crawler adalah metode yang paling umum dan direkomendasikan untuk mengisi Katalog Data karena mereka dapat secara otomatis menemukan dan menyimpulkan metadata untuk berbagai sumber data.

  • Menambahkan metadata secara manual — Anda dapat menentukan database, tabel, dan detail koneksi secara manual dan menambahkannya ke Katalog Data menggunakan konsol, AWS Glue konsol Lake Formation AWS CLI, atau API. AWS Glue Entri manual berguna saat Anda ingin membuat katalog sumber data yang tidak dapat dirayapi.

  • Mengintegrasikan dengan AWS layanan lain — Anda dapat mengisi Katalog Data dengan metadata dari layanan seperti dan Amazon AWS Lake Formation Athena. Layanan ini dapat menemukan dan mendaftarkan sumber data di Katalog Data.

  • Mengisi dari repositori metadata yang ada — Jika Anda memiliki penyimpanan metadata yang ada seperti Apache Hive Metastore, Anda dapat menggunakannya untuk mengimpor metadata tersebut ke dalam Katalog Data. AWS Glue Untuk informasi selengkapnya, lihat Migrasi antara Metastore Hive dan on. AWS Glue Data Catalog GitHub