ColumnDataType - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

ColumnDataType

Memeriksa tipe data inheren dari nilai-nilai dalam kolom tertentu terhadap jenis yang diharapkan disediakan. Menerima with threshold ekspresi untuk memeriksa subset nilai di kolom.

Sintaksis

ColumnDataType <COL_NAME> = <EXPECTED_TYPE>
  • COL_ NAME — Nama kolom yang ingin Anda evaluasi terhadap aturan kualitas data.

    Jenis kolom yang didukung: Jenis string

    Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek

  • EXPECTED_ TYPE — Jenis nilai yang diharapkan di kolom.

    Nilai yang didukung: Boolean, Date, Timestamp, Integer, Double, Float, Long

    Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek

  • EXPRESSION— Ekspresi opsional untuk menentukan persentase nilai yang harus dari tipe yang diharapkan.

    Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek

Contoh: Kolom tipe data bilangan bulat sebagai string

Contoh aturan berikut memeriksa apakah nilai-nilai dalam kolom yang diberikan, yang bertipe string, sebenarnya bilangan bulat.

ColumnDataType "colA" = "INTEGER"

Contoh: Bilangan bulat tipe data kolom sebagai string memeriksa subset dari nilai

Contoh aturan berikut memeriksa apakah lebih dari 90% dari nilai-nilai dalam kolom yang diberikan, yang bertipe string, sebenarnya bilangan bulat.

ColumnDataType "colA" = "INTEGER" with threshold > 0.9