Menggunakan tabel Katalog Data untuk sumber data

Untuk semua sumber data kecuali Amazon S3 dan konektor, tabel harus ada di AWS Glue Data Catalog untuk jenis sumber yang Anda pilih. AWS Gluetidak membuat tabel Katalog Data.

Untuk mengkonfigurasi simpul sumber data berdasarkan tabel Katalog Data

Pergi ke editor visual untuk sebuah tugas baru atau yang sudah disimpan.
Pilih simpul sumber data dalam diagram tugas.
Pilih tab Properti sumber data, dan kemudian masukkan informasi berikut:
- Tipe sumber S3: (Untuk sumber data Amazon S3 saja) Pilih opsi Pilih tabel Katalog untuk menggunakan tabel AWS Glue Data Catalog.
- Basis data: Pilih basis data dalam Katalog Data yang berisi tabel sumber yang ingin Anda gunakan untuk tugas ini. Anda dapat menggunakan bidang pencarian untuk mencari basis data berdasarkan namanya.
- Tabel: Pilih tabel yang telah dikaitkan dengan sumber data dari daftar. Tabel ini harus sudah ada dalam AWS Glue Data Catalog. Anda dapat menggunakan bidang pencarian untuk mencari tabel berdasarkan namanya.
- Predikat partisi: (Untuk sumber data Amazon S3 saja) Masukkan ekspresi Boolean berdasarkan Spark SQL yang hanya mencakup kolom pemartisian. Misalnya: "(year=='2020' and month=='04')"
- Direktori sementara: (Untuk sumber data Amazon Redshift saja) Masukkan path untuk lokasi direktori kerja di Amazon S3 di mana tugas ETL Anda dapat menulis hasil antara sementara.
- Peran yang dikaitkan dengan klaster: (Untuk sumber data Amazon Redshift saja) Masukkan sebuah peran untuk tugas ETL Anda untuk menggunakan yang berisi izin untuk klaster Amazon Redshift. Untuk informasi selengkapnya, lihat Izin sumber data dan target data.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Memodifikasi properti dari node sumber data

Menggunakan sebuah konektor untuk sumber data