Memahami tabel, database, dan katalog data di Athena - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memahami tabel, database, dan katalog data di Athena

Di Athena, katalog, database, dan tabel adalah wadah untuk definisi metadata yang mendefinisikan skema untuk data sumber yang mendasarinya.

Athena menggunakan istilah berikut untuk merujuk ke hierarki objek data:

  • Sumber data — sekelompok database

  • Database — sekelompok tabel

  • Tabel — data yang disusun sebagai sekelompok baris atau kolom

Terkadang objek-objek ini juga disebut dengan nama alternatif tetapi setara seperti berikut ini:

  • Sumber data terkadang disebut sebagai katalog.

  • Database kadang-kadang disebut sebagai skema.

catatan

Terminologi ini dapat bervariasi dalam sumber data federasi yang Anda gunakan dengan Athena. Untuk informasi selengkapnya, lihat Memahami kualifikasi nama tabel federasi.

Contoh query berikut di konsol Athena menggunakan sumber awsdatacatalog data, default database, dan tabelsome_table.

Hirarki objek data di editor kueri Athena.

Untuk setiap dataset, tabel harus ada di Athena. Metadata dalam tabel memberi tahu Athena tempat data berada di Amazon S3, dan menentukan struktur data, misalnya, nama kolom, tipe data, dan nama tabel. Database adalah pengelompokan tabel yang logis, dan juga hanya menyimpan informasi metadata dan skema untuk kumpulan data.

Untuk setiap kumpulan data yang ingin Anda kueri, Athena harus memiliki tabel dasar yang akan digunakan untuk mendapatkan dan mengembalikan hasil kueri. Karena itu, sebelum menanyakan data, tabel harus didaftarkan di Athena. Pendaftaran terjadi ketika Anda membuat tabel secara otomatis atau manual.

Anda dapat membuat tabel secara otomatis menggunakan AWS Glue crawler. Untuk informasi selengkapnya tentang AWS Glue dan crawler, lihatGunakan AWS Glue untuk menghubungkan Athena ke data Anda di Amazon S3. Ketika AWS Glue membuat tabel, ia mendaftarkannya dalam Katalog AWS Glue Data sendiri. Athena menggunakan Katalog AWS Glue Data untuk menyimpan dan mengambil metadata ini, menggunakannya saat Anda menjalankan kueri untuk menganalisis kumpulan data yang mendasarinya.

Terlepas dari bagaimana tabel dibuat, proses pembuatan tabel mendaftarkan dataset dengan Athena. Pendaftaran ini terjadi di AWS Glue Data Catalog dan memungkinkan Athena untuk menjalankan kueri pada data. Di editor kueri Athena, katalog ini (atau sumber data) dirujuk dengan label. AwsDataCatalog

Setelah membuat tabel, Anda dapat menggunakan SQLSELECTpernyataan untuk menanyainya, termasuk mendapatkan lokasi file tertentu untuk data sumber Anda. Hasil kueri Anda disimpan di Amazon S3 di lokasi hasil kueri yang Anda tentukan.

Katalog AWS Glue Data dapat diakses di seluruh akun Amazon Web Services Anda. Lainnya Layanan AWS dapat berbagi Katalog AWS Glue Data, sehingga Anda dapat melihat database dan tabel yang dibuat di seluruh organisasi Anda menggunakan Athena dan sebaliknya.

  • Untuk membuat tabel secara manual:

    • Gunakan konsol Athena untuk menjalankan Create Table Wizard.

    • Gunakan konsol Athena untuk menulis DDL pernyataan Hive di Editor Kueri.

    • Gunakan Athena API atau CLI untuk menjalankan string SQL query dengan DDL pernyataan.

    • Gunakan Athena JDBC atau ODBC sopir.

Saat Anda membuat tabel dan database secara manual, Athena menggunakan pernyataan HiveQL data definition language DDL () CREATE TABLE sepertiCREATE DATABASE,, DROP TABLE dan di bawah tenda untuk membuat tabel dan database di. AWS Glue Data Catalog

Untuk memulai, Anda dapat menggunakan tutorial di konsol Athena atau mengerjakan step-by-step panduan dalam dokumentasi Athena.

  • Untuk menggunakan tutorial di konsol Athena, pilih ikon informasi di kanan atas konsol, lalu pilih tab Tutorial.

  • Untuk step-by-step tutorial tentang membuat tabel dan menulis kueri di editor kueri Athena, lihat. Memulai