Mengaktifkan pembuatan statistik otomatis tingkat katalog - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengaktifkan pembuatan statistik otomatis tingkat katalog

Anda dapat mengaktifkan pembuatan statistik kolom otomatis untuk semua tabel dan tabel Apache Iceberg baru dalam format OTF non-tabel (Parket,,,,JSON, CSV XMLORC,ION) dalam Katalog Data. Setelah membuat tabel, Anda juga dapat secara eksplisit memperbarui pengaturan statistik kolom secara manual.

Untuk memperbarui pengaturan Katalog Data untuk mengaktifkan tingkat katalog, IAM peran yang digunakan harus memiliki glue:UpdateCatalog izin atau AWS Lake Formation ALTER CATALOG izin pada katalog root. Anda dapat menggunakan GetCatalog API untuk memverifikasi properti katalog.

AWS Management Console
Untuk mengaktifkan pembuatan statistik kolom otomatis di tingkat akun
  1. Buka konsol Lake Formation di https://console.aws.amazon.com/lakeformation/.

  2. Di bilah navigasi kiri, pilih Katalog.

  3. Pada halaman ringkasan Katalog, pilih Edit di bawah konfigurasi Optimasi.

    Tangkapan layar menunjukkan opsi yang tersedia untuk menghasilkan statistik kolom.
  4. Pada halaman konfigurasi pengoptimalan tabel, pilih opsi Aktifkan pembuatan statistik otomatis untuk tabel katalog.

    Tangkapan layar menunjukkan opsi yang tersedia untuk menghasilkan statistik kolom.
  5. Pilih IAM peran yang ada atau buat peran baru yang memiliki izin yang diperlukan untuk menjalankan tugas statistik kolom.

  6. Pilih Kirim.

AWS CLI

Anda juga dapat mengaktifkan pengumpulan statistik tingkat katalog melalui. AWS CLI Untuk mengonfigurasi pengumpulan statistik tingkat tabel menggunakan AWS CLI, jalankan perintah berikut:

aws glue update-catalog --cli-input-json '{
    "name": "123456789012",
    "catalogInput": {
        "description": "Updating root catalog with role arn",
        "catalogProperties": {
            "customProperties": {
                "ColumnStatistics.RoleArn": "arn:aws:iam::"123456789012":role/service-role/AWSGlueServiceRole",
                "ColumnStatistics.Enabled": "true"
            }
        }
    }
}'
                   

Perintah di atas memanggil AWS GlueUpdateCatalog operasi, yang mengambil CatalogProperties struktur dengan pasangan nilai kunci berikut untuk pembuatan statistik tingkat katalog:

  • ColumnStatistics. RoleArn — IAM peran ARN yang akan digunakan untuk semua tugas yang dipicu untuk pembuatan statistik tingkat Katalog

  • ColumnStatistics.Enabled - Boolean menunjukkan apakah pengaturan tingkat katalog diaktifkan atau dinonaktifkan