Melihat statistik kolom - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Melihat statistik kolom

Setelah berhasil menghasilkan statistik, Data Catalog menyimpan informasi ini untuk pengoptimal berbasis biaya di dan Amazon Amazon Athena Redshift untuk membuat pilihan optimal saat menjalankan kueri. Statistik bervariasi berdasarkan jenis kolom.

AWS Management Console
Untuk melihat statistik kolom untuk tabel
  • Setelah menjalankan tugas statistik kolom, tab Statistik kolom pada halaman Rincian tabel menunjukkan statistik untuk tabel.

    Tangkapan layar menunjukkan kolom yang dihasilkan dari proses terbaru.

    Statistik berikut tersedia:

    • Nama kolom: Nama kolom yang digunakan untuk menghasilkan statistik

    • Terakhir diperbarui: Data dan waktu ketika statistik dihasilkan

    • Panjang rata-rata: Panjang rata-rata nilai di kolom

    • Nilai yang berbeda: Jumlah total nilai yang berbeda di kolom. Kami memperkirakan jumlah nilai yang berbeda dalam kolom dengan kesalahan relatif 5%.

    • Nilai maks: Nilai terbesar di kolom.

    • Nilai min: Nilai terkecil di kolom.

    • Panjang maks: Panjang nilai tertinggi di kolom.

    • Nilai nol: Jumlah total nilai null di kolom.

    • Nilai sebenarnya: Jumlah total nilai sebenarnya di kolom.

    • Nilai palsu: Jumlah total nilai palsu di kolom.

    • NumFiles: Jumlah total file dalam tabel. Nilai ini tersedia di bawah tab Advanced properties.

AWS CLI

Contoh berikut menunjukkan bagaimana untuk mengambil statistik kolom menggunakan AWS CLI.

aws glue get-column-statistics-for-table \ --database-name <test_db> \ --table-name <test_tble> \ --column-names <col1>

Anda juga dapat melihat statistik kolom menggunakan operasi GetColumnStatisticsForTableAPI.