Integrasi dengan layanan lain AWS - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Integrasi dengan layanan lain AWS

Meskipun Anda dapat menggunakan Perayap AWS Glue s untuk mengisi AWS Glue Data Catalog, ada beberapa AWS layanan yang dapat secara otomatis terintegrasi dengan dan mengisi katalog untuk Anda. Bagian berikut memberikan informasi selengkapnya tentang kasus penggunaan spesifik yang didukung oleh AWS layanan yang dapat mengisi Katalog Data.

AWS Lake Formation

AWS Lake Formation adalah layanan yang membuatnya lebih mudah untuk mengatur danau data yang aman di AWS. Lake Formation dibangun di atas AWS Glue, dan Lake Formation dan AWS Glue berbagi hal yang sama AWS Glue Data Catalog. Anda dapat mendaftarkan lokasi data Amazon S3 Anda dengan Lake Formation, dan menggunakan konsol Lake Formation untuk membuat database dan tabel di Katalog AWS Glue Data, menentukan kebijakan akses data, dan mengaudit akses data di seluruh danau data Anda dari tempat sentral. Anda dapat menggunakan kontrol akses berbutir halus Lake Formation untuk mengelola sumber daya Katalog Data dan lokasi data Amazon S3 yang ada.

Dengan data yang terdaftar di Lake Formation, Anda dapat berbagi sumber daya Katalog Data dengan aman di seluruh kepala sekolah, AWS akun, organisasi, dan unit AWS organisasi IAM.

Untuk informasi selengkapnya tentang membuat sumber daya Katalog Data menggunakan Lake Formation, lihat Membuat tabel dan database Katalog Data di Panduan AWS Lake Formation Pengembang.

Amazon Athena

Amazon Athena menggunakan Katalog Data untuk menyimpan dan mengambil metadata tabel untuk data Amazon S3 di akun Anda. AWS Metadata tabel memungkinkan mesin permintaan Athena tahu bagaimana menemukan, membaca, dan memproses data yang ingin Anda kueri.

Anda dapat mengisi AWS Glue Data Catalog dengan menggunakan pernyataan CREATE TABLE Athena secara langsung. Anda dapat secara manual menentukan dan mengisi skema dan metadata partisi di Katalog Data tanpa perlu menjalankan crawler.

  1. Di konsol Athena, buat database yang akan menyimpan metadata tabel di Katalog Data.

  2. Gunakan CREATE EXTERNAL TABLE pernyataan untuk menentukan skema sumber data Anda.

  3. Gunakan PARTITIONED BY klausa untuk menentukan kunci partisi apa pun jika data Anda dipartisi.

  4. Gunakan LOCATION klausa untuk menentukan jalur Amazon S3 tempat file data aktual Anda disimpan.

  5. Jalankan pernyataan CREATE TABLE.

    Kueri ini membuat metadata tabel di Katalog Data berdasarkan skema dan partisi yang Anda tentukan, tanpa benar-benar merayapi data.

Anda dapat menanyakan tabel di Athena, dan itu akan menggunakan metadata dari Katalog Data untuk mengakses dan menanyakan file data Anda di Amazon S3.

Untuk informasi selengkapnya, lihat Membuat database dan tabel di Panduan Pengguna Amazon Athena.