Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

FileSize

Mode fokus
FileSize - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

FileSize RuleType memungkinkan Anda untuk memastikan bahwa file memenuhi kriteria ukuran file tertentu. Ini berguna untuk kasus penggunaan berikut:

  1. Pastikan bahwa produsen tidak mengirim file kosong atau jauh lebih kecil untuk diproses.

  2. Pastikan bucket target Anda tidak memiliki file yang lebih kecil yang dapat menyebabkan masalah kinerja.

FileSize mengumpulkan metrik berikut:

  1. Kepatuhan: mengembalikan% file yang memenuhi ambang batas aturan yang telah Anda buat

  2. Jumlah File: jumlah file yang dipindai oleh aturan

  3. Ukuran file minimum dalam byte

  4. Ukuran file maksimum dalam byte

Dataset.*.FileSize.Compliance: 1.00, Dataset.*.FileCount: 8.00, Dataset.*.MaximumFileSize: 327413121.00, Dataset.*.MinimumFileSize: 204558920.00

Deteksi anomali tidak didukung untuk metrik ini.

Validasi ukuran file

Aturan ini akan berlalu ketika file.dat lebih besar dari 2 MB.

FileSize "s3://amzn-s3-demo-bucket/file.dat" > 2 MB

Unites yang didukung termasuk B (byte), MB (mega byte), GB (giga byte) dan TB (terra byte).

Validasi ukuran file dalam folder

FileSize "s3://bucket/" > 5 B FileSize "s3://bucket/" < 2 GB

Aturan ini akan berlalu jika 70% file di s3://amzn-s3-demo-bucket adalah antara 2 GB dan 1 TB.

FileSize "s3://amzn-s3-demo-bucket/" between 2 GB and 1 TB with threshold > 0.7

Menyimpulkan nama file langsung dari bingkai data

Anda tidak selalu harus menyediakan jalur file. Misalnya, ketika Anda menulis aturan di Katalog Data, mungkin sulit untuk menemukan folder mana yang digunakan tabel katalog. AWS Glue Data Quality dapat menemukan folder atau file tertentu yang digunakan untuk mengisi bingkai data Anda.

catatan

Fitur ini hanya akan berfungsi ketika file berhasil dibaca ke dalam DynamicFrame atau DataFrame.

FileSize < 10 MB with threshold > 0.7

Tag Aturan Berbasis File Opsional:

Tag memungkinkan Anda untuk mengontrol perilaku aturan.

RecentFiles

Tag ini membatasi jumlah file yang diproses dengan menyimpan file terbaru terlebih dahulu.

FileSize "s3://amzn-s3-demo-bucket/" > 5 B with recentFiles = 1

matchFileName

Tag ini memastikan bahwa file tidak memiliki nama duplikat. Perilaku default adalah false.

FileSize "s3://amzn-s3-demo-bucket/" > 5 B with matchFileName = "true"

Ada beberapa pertimbangan:

  1. Di AWS Glue ETL, Anda harus memiliki DataQuality Evaluate Transform segera setelah Amazon S3 atau Data Catalog berubah.

  2. Aturan ini tidak akan berfungsi di AWS Glue Interactive Sessions.

PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.