Optimalkan kueri dengan pengindeksan dan AWS Glue pemfilteran partisi - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Optimalkan kueri dengan pengindeksan dan AWS Glue pemfilteran partisi

Ketika Athena menanyakan tabel yang dipartisi, Athena mengambil dan memfilter partisi tabel yang tersedia ke subset yang relevan dengan kueri Anda. Saat data dan partisi baru ditambahkan, lebih banyak waktu diperlukan untuk memproses partisi, dan runtime kueri dapat meningkat. Jika Anda memiliki tabel dengan sejumlah besar partisi yang tumbuh seiring waktu, pertimbangkan untuk menggunakan pengindeksan dan penyaringan AWS Glue partisi. Pengindeksan partisi memungkinkan Athena untuk mengoptimalkan pemrosesan partisi dan meningkatkan kinerja kueri pada tabel yang sangat dipartisi. Menyiapkan pemfilteran partisi dalam properti tabel adalah proses dua langkah:

  1. Membuat indeks partisi di AWS Glue.

  2. Mengaktifkan pemfilteran partisi untuk tabel.

Membuat indeks partisi

Untuk langkah-langkah membuat indeks partisi AWS Glue, lihat Bekerja dengan indeks partisi di Panduan AWS Glue Pengembang. Untuk batasan indeks partisi di AWS Glue, lihat bagian Tentang indeks partisi di halaman itu.

Mengaktifkan pemfilteran partisi

Untuk mengaktifkan pemfilteran partisi untuk tabel, Anda harus mengatur properti tabel baru di AWS Glue. Untuk langkah-langkah tentang cara mengatur properti tabel AWS Glue, lihat halaman Menyiapkan proyeksi partisi. Saat Anda mengedit detail tabel AWS Glue, tambahkan pasangan kunci-nilai berikut ke bagian Properti tabel:

  • Untuk Key, tambahkan partition_filtering.enabled

  • Untuk Nilai, tambahkan true

Anda dapat menonaktifkan pemfilteran partisi pada tabel ini kapan saja dengan menyetel partition_filtering.enabled nilainya. false

Setelah Anda menyelesaikan langkah-langkah di atas, Anda dapat kembali ke konsol Athena untuk menanyakan data.

Untuk informasi selengkapnya tentang penggunaan pengindeksan dan pemfilteran partisi, lihat Meningkatkan kinerja kueri Amazon Athena AWS Glue Data Catalog menggunakan indeks partisi di AWS Blog Big Data.