Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Secara default, saat crawler mendefinisikan tabel untuk data yang disimpan di Amazon S3, crawler mencoba menggabungkan skema bersama-sama, dan membuat tabel tingkat atas (). year=2019
Dalam beberapa kasus, Anda mungkin mengharapkan sebuah crawler membuat tabel untuk folder month=Jan
namun crawler membuat partisi karena folder saudara (month=Mar
) digabung ke dalam tabel yang sama.
Opsi crawler tingkat tabel memberikan fleksibilitas untuk memberitahu crawler di mana tabel berada, dan bagaimana Anda ingin membuat partisi. Bila Anda menentukan sebuah Tingkat tabel, tabel tersebut dibuat pada tingkat absolut dari bucket Amazon S3.

Saat mengkonfigurasi crawler di konsol, Anda dapat menentukan nilai untuk opsi crawler Tingkat tabel. Nilai-nya harus bilangan bulat positif yang menunjukkan lokasi tabel (tingkat absolut dalam set data). Tingkat untuk folder tingkat atas adalah 1. Misalnya, untuk path mydataset/year/month/day/hour
, jika tingkat diatur ke 3, maka tabel dibuat di lokasi mydataset/year/month
.
Masuk ke AWS Management Console dan buka AWS Glue konsol di https://console.aws.amazon.com/glue/
. -
Pilih Crawler di bawah Katalog Data.
Saat Anda mengonfigurasi crawler, di bawah Output dan penjadwalan, pilih Tingkat tabel di bawah Opsi lanjutan.
