Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan tabel Katalog Data untuk sumber data
Untuk semua sumber data kecuali Amazon S3 dan konektor, tabel harus ada di AWS Glue Data Catalog untuk jenis sumber yang Anda pilih. AWS Gluetidak membuat tabel Katalog Data.
Untuk mengkonfigurasi simpul sumber data berdasarkan tabel Katalog Data
-
Pergi ke editor visual untuk sebuah tugas baru atau yang sudah disimpan.
-
Pilih simpul sumber data dalam diagram tugas.
-
Pilih tab Properti sumber data, dan kemudian masukkan informasi berikut:
-
Tipe sumber S3: (Untuk sumber data Amazon S3 saja) Pilih opsi Pilih tabel Katalog untuk menggunakan tabel AWS Glue Data Catalog.
-
Basis data: Pilih basis data dalam Katalog Data yang berisi tabel sumber yang ingin Anda gunakan untuk tugas ini. Anda dapat menggunakan bidang pencarian untuk mencari basis data berdasarkan namanya.
-
Tabel: Pilih tabel yang telah dikaitkan dengan sumber data dari daftar. Tabel ini harus sudah ada dalam AWS Glue Data Catalog. Anda dapat menggunakan bidang pencarian untuk mencari tabel berdasarkan namanya.
-
Predikat partisi: (Untuk sumber data Amazon S3 saja) Masukkan ekspresi Boolean berdasarkan Spark SQL yang hanya mencakup kolom pemartisian. Misalnya:
"(year=='2020' and month=='04')"
-
Direktori sementara: (Untuk sumber data Amazon Redshift saja) Masukkan path untuk lokasi direktori kerja di Amazon S3 di mana tugas ETL Anda dapat menulis hasil antara sementara.
-
Peran yang dikaitkan dengan klaster: (Untuk sumber data Amazon Redshift saja) Masukkan sebuah peran untuk tugas ETL Anda untuk menggunakan yang berisi izin untuk klaster Amazon Redshift. Untuk informasi selengkapnya, lihat Izin sumber data dan target data.
-