Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mempersiapkan data input
Format data masukan Anda sebagai file Apache Parquet
Ikhtisar skema masukan
Data masukan Anda harus sesuai dengan skema untuk jenis tindakan pekerjaan tertentu yang ingin Anda jalankan. Setiap jenis tindakan mendefinisikan kumpulan bidang wajib dan opsional sendiri.
Semua skema masukan mendukung Id bidang opsional. Gunakan bidang ini untuk menetapkan pengenal untuk setiap catatan masukan. Jika Anda memberikan Id nilai, itu muncul seperti Input_Id pada output, memungkinkan Anda untuk mengkorelasikan catatan keluaran dengan input yang sesuai.
Untuk detail skema masukan validasi alamat, lihat Skema masukan validasi alamat.
Batas ukuran file
File input memiliki batasan sebagai berikut:
-
Ukuran file maksimal: 10 GB per file
-
Ukuran row-group Parket maksimal: 1 GB
-
File maksimum per awalan input: 1000