Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
AWS Glue crawler membantu menemukan skema untuk kumpulan data dan mendaftarkannya sebagai tabel di Katalog Data. AWS Glue Crawler menelusuri data Anda dan menentukan skema. Selain itu, crawler dapat mendeteksi dan mendaftarkan partisi. Untuk informasi selengkapnya, lihat Mendefinisikan crawler di Panduan AWS Glue Pengembang. Tabel dari data yang berhasil dirayapi dapat ditanyakan dari Athena.
catatan
Athena tidak mengenali pola pengecualian yang Anda tentukan untuk crawler. AWS Glue Misalnya, jika Anda memiliki bucket Amazon S3 yang berisi keduanya.csv
dan.json
file dan Anda mengecualikan.json
file dari crawler, Athena mengkueri kedua grup file. Untuk menghindari hal ini, menempatkan file yang ingin Anda mengecualikan di lokasi yang berbeda.
Buat AWS Glue crawler
Anda dapat membuat crawler dengan memulai di konsol Athena dan kemudian menggunakan konsol AWS Glue secara terintegrasi. Saat membuat crawler, Anda menentukan lokasi data di Amazon S3 untuk dirayapi.
Untuk membuat crawler di AWS Glue mulai dari konsol Athena
Buka konsol Athena di https://console.aws.amazon.com/athena/
. -
Di editor kueri, di samping Tabel dan tampilan, pilih Buat, lalu pilih AWS Glue crawler.
-
PadaAWS GlueKonsolTambahkan crawler, ikuti langkah-langkah untuk membuat crawler. Untuk informasi selengkapnya, lihat Menggunakan AWS Glue Crawler dalam panduan ini dan Mengisi AWS Glue Data Catalog di Panduan AWS Glue Pengembang.
catatan
Athena tidak mengenali pola pengecualian yang Anda tentukan untuk crawler. AWS Glue Misalnya, jika Anda memiliki bucket Amazon S3 yang berisi keduanya.csv
dan.json
file dan Anda mengecualikan.json
file dari crawler, Athena mengkueri kedua grup file. Untuk menghindari hal ini, menempatkan file yang ingin Anda mengecualikan di lokasi yang berbeda.
Setelah crawl, AWS Glue crawler secara otomatis menetapkan metadata tabel tertentu untuk membantu membuatnya kompatibel dengan teknologi eksternal lainnya seperti Apache Hive, Presto, dan Spark. Kadang-kadang, crawler mungkin salah menetapkan properti metadata. Perbaiki properti secara manual AWS Glue sebelum menanyakan tabel menggunakan Athena. Untuk informasi selengkapnya, lihat Melihat dan mengedit detail tabel di Panduan AWS Glue Pengembang.
AWS Glue mungkin salah menetapkan metadata ketika file CSV memiliki tanda kutip di sekitar setiap bidang data, membuat properti salah. serializationLib
Untuk informasi selengkapnya, lihat Menangani data CSV terlampir dalam tanda kutip.