Gunakan formulir di konsol Athena untuk menambahkan tabel AWS Glue - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gunakan formulir di konsol Athena untuk menambahkan tabel AWS Glue

Prosedur berikut menunjukkan cara menggunakan konsol Athena untuk menambahkan tabel menggunakan formulir data bucket Create Table From S3.

Untuk menambahkan tabel dan memasukkan informasi skema menggunakan formulir
  1. Buka konsol Athena di https://console.aws.amazon.com/athena/.

  2. Di editor kueri, di samping Tabel dan tampilan, pilih Buat, lalu pilih data bucket S3.

  3. Pada formulir data bucket Create Table From S3, untuk nama Table, masukkan nama untuk tabel. Untuk informasi tentang karakter yang dapat diterima untuk nama database, nama tabel, dan nama kolom di Athena, lihat. Nama database, tabel, dan kolom

  4. Untuk konfigurasi Database, pilih database yang ada, atau buat yang baru.

  5. UntukLokasi Set Input Data, tentukan jalur di Amazon S3 ke folder yang berisi kumpulan data yang ingin Anda proses. Jangan sertakan nama file di jalur. Athena memindai semua file di folder yang Anda tentukan. Jika data Anda sudah dipartisi (misalnya,

    s3://amzn-s3-demo-bucket/logs/year=2004/month=12/day=11/), masukkan jalur dasar saja (misalnya, s3://amzn-s3-demo-bucket/logs/).

  6. Untuk Format Data, pilih di antara opsi berikut:

    • Untuk tipe Table, pilih Apache Hive, Apache Iceberg, atau Delta Lake. Athena menggunakan jenis tabel Apache Hive sebagai default. Untuk informasi tentang menanyakan tabel Apache Iceberg di Athena, lihat. Tabel Query Apache Iceberg Untuk informasi tentang penggunaan tabel Danau Delta di Athena, lihat. Tabel Query Linux Foundation Delta Lake

    • Untuk format File, pilih format file atau log tempat data Anda berada.

      • UntukBerkas Teks dengan Pembatas Kustompilihan, tentukanBidang terminator(yaitu pembatas kolom). Secara opsional, Anda dapat menentukan terminator Collection yang menandai akhir dari tipe array atau terminator Collection yang menandai akhir dari tipe data peta.

    • SerDe library — Pustaka SerDe (serializer-deserializer) mem-parsing format data tertentu sehingga Athena dapat membuat tabel untuk itu. Untuk sebagian besar format, SerDe pustaka default dipilih untuk Anda. Untuk format berikut, pilih perpustakaan sesuai dengan kebutuhan Anda:

      • Apache Web Logs - Pilih salah satu RegexSerDeatau GrokSerDeperpustakaan. Untuk RegexSerDe, berikan ekspresi reguler di kotak definisi Regex. Untuk GrokSerDe, berikan serangkaian ekspresi reguler bernama untuk input.format SerDe properti. Ekspresi reguler bernama lebih mudah dibaca dan dipelihara daripada ekspresi reguler. Untuk informasi selengkapnya, lihat Kueri log Apache disimpan di Amazon S3.

      • CSV— Pilih LazySimpleSerDeapakah data yang dipisahkan koma Anda tidak berisi nilai yang terlampir dalam tanda kutip ganda atau jika menggunakan format. java.sql.Timestamp Pilih O penCSVSer De jika data Anda menyertakan tanda kutip atau menggunakan format UNIX numerik untuk TIMESTAMP (misalnya,1564610311). Untuk informasi selengkapnya, silakan lihat Malas Sederhana SerDe untukCSV,TSV, dan file yang dibatasi khusus dan Terbuka CSV SerDe untuk diproses CSV.

      • JSON— Pilih perpustakaan OpenX atau JSON SerDe Hive. Kedua format mengharapkan setiap JSON dokumen berada pada satu baris teks dan bidang tersebut tidak dipisahkan oleh karakter baris baru. OpenX SerDe menawarkan beberapa properti tambahan. Untuk informasi selengkapnya tentang properti ini, lihat OpenX JSON SerDe. Untuk informasi tentang Hive SerDe, lihatSarang JSON SerDe.

      Untuk informasi lebih lanjut tentang penggunaan SerDe perpustakaan di Athena, lihat. Pilih SerDe untuk data Anda

  7. Untuk SerDe properti, tambahkan, edit, atau hapus properti dan nilai sesuai dengan SerDe pustaka yang Anda gunakan dan kebutuhan Anda.

    • Untuk menambahkan SerDe properti, pilih Tambah SerDe properti.

    • Di bidang Nama, masukkan nama properti.

    • Di bidang Nilai, masukkan nilai untuk properti.

    • Untuk menghapus SerDe properti, pilih Hapus.

  8. Untuk properti Tabel, pilih atau edit properti tabel sesuai dengan kebutuhan Anda.

    • Untuk kompresi Tulis, pilih opsi kompresi. Ketersediaan opsi kompresi tulis dan opsi kompresi yang tersedia tergantung pada format data. Untuk informasi selengkapnya, lihat Gunakan kompresi di Athena.

    • Untuk Enkripsi, pilih Kumpulan data terenkripsi jika data yang mendasarinya dienkripsi di Amazon S3. Opsi ini menetapkan properti has_encrypted_data tabel ke true dalam CREATE TABLE pernyataan.

  9. Untuk detail Kolom, masukkan nama dan tipe data kolom yang ingin Anda tambahkan ke tabel.

    • Untuk menambahkan lebih banyak kolom satu per satu, pilihTambahkan kolom.

    • Untuk menambahkan lebih banyak kolom dengan cepat, pilihTambahkan kolom. Di kotak teks, masukkan daftar kolom yang dipisahkan koma dalam format column_name data_type, column_name data_type[,...], dan kemudian pilih Tambah.

  10. (Opsional) Untuk detail Partisi, tambahkan satu atau beberapa nama kolom dan tipe data. Partisi menyimpan data terkait bersama-sama berdasarkan nilai kolom dan dapat membantu mengurangi jumlah data yang dipindai per kueri. Untuk informasi tentang partisi, lihat Partisi data Anda.

  11. (Opsional) Untuk Bucketing, Anda dapat menentukan satu atau beberapa kolom yang memiliki baris yang ingin Anda kelompokkan bersama, lalu menempatkan baris tersebut ke dalam beberapa ember. Hal ini memungkinkan Anda untuk menanyakan hanya bucket yang ingin Anda baca saat nilai kolom berember ditentukan.

    • Untuk Bucket, pilih satu atau beberapa kolom yang memiliki sejumlah besar nilai unik (misalnya, kunci utama) dan yang sering digunakan untuk memfilter data dalam kueri Anda.

    • Untuk Jumlah ember, masukkan nomor yang memungkinkan file berukuran optimal. Untuk informasi selengkapnya, lihat 10 Tips Penyetelan Kinerja Terbaik untuk Amazon Athena di Blog Big AWS Data.

    • Untuk menentukan kolom bucketed Anda, CREATE TABLE pernyataan akan menggunakan sintaks berikut:

      CLUSTERED BY (bucketed_columns) INTO number_of_buckets BUCKETS
    catatan

    Opsi Bucketing tidak tersedia untuk jenis tabel Iceberg.

  12. Kotak kueri tabel pratinjau menunjukkan CREATE TABLE pernyataan yang dihasilkan oleh informasi yang Anda masukkan ke dalam formulir. Pernyataan pratinjau tidak dapat diedit secara langsung. Untuk mengubah pernyataan, ubah bidang formulir di atas pratinjau, atau buat pernyataan langsung di editor kueri alih-alih menggunakan formulir.

  13. Pilih Buat tabel untuk menjalankan pernyataan yang dihasilkan di editor kueri dan buat tabel.