Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
BDA memungkinkan Anda untuk menentukan bidang data tertentu yang ingin Anda ekstrak dari dokumen Anda saat membuat cetak biru. Ini bertindak sebagai seperangkat instruksi yang memandu BDA tentang informasi apa yang harus dicari dan bagaimana menafsirkannya.
Mendefinisikan bidang
Untuk memulai, Anda dapat membuat properti untuk setiap bidang yang memerlukan ekstraksi, seperti employee_id atau product_name. Untuk setiap bidang, Anda perlu memberikan deskripsi, tipe data, dan tipe inferensi.
Untuk menentukan bidang untuk ekstraksi, Anda perlu menentukan parameter berikut:
-
Nama Bidang: Memberikan penjelasan yang dapat dibaca manusia tentang apa yang diwakili oleh bidang tersebut. Deskripsi ini membantu dalam memahami konteks dan tujuan lapangan, membantu dalam ekstraksi data yang akurat.
-
Instruksi: Memberikan penjelasan bahasa alami tentang apa yang diwakili oleh bidang tersebut. Deskripsi ini membantu dalam memahami konteks dan tujuan lapangan, membantu dalam ekstraksi data yang akurat.
-
Jenis: Menentukan tipe data dari nilai bidang ini. BDA mendukung tipe data berikut:
-
string: Untuk nilai berbasis teks
-
nomor: Untuk nilai numerik
-
boolean: Untuk nilai benar/salah
-
array: Untuk bidang yang dapat memiliki beberapa nilai dari jenis yang sama (misalnya, array string atau array angka)
-
-
Jenis Inferensi: Menginstruksikan BDA tentang cara menangani ekstraksi nilai bidang. Jenis inferensi yang didukung adalah:
-
Eksplisit: BDA harus mengekstrak nilai langsung dari dokumen.
-
Disimpulkan: BDA harus menyimpulkan nilai berdasarkan informasi yang ada dalam dokumen.
-
Berikut adalah contoh definisi bidang dengan semua parameter:

Dalam contoh ini:
-
Tipe diatur ke string, menunjukkan bahwa nilai bidang product_name harus berbasis teks.
-
InferenceType diatur ke Eksplisit, menginstruksikan BDA untuk mengekstrak nilai langsung dari dokumen tanpa transformasi atau validasi apa pun.
-
Instruksi memberikan konteks tambahan, mengklarifikasi bahwa bidang tersebut harus berisi nama pendek produk tanpa detail tambahan.
Dengan menentukan parameter ini untuk setiap bidang, Anda memberikan BDA informasi yang diperlukan untuk secara akurat mengekstrak dan menafsirkan data yang diinginkan dari dokumen Anda.
Bidang | Instruksi | Jenis Ekstraksi | Tipe |
---|---|---|---|
ApplicantsName |
Nama Lengkap Pemohon |
Eksplisit |
string |
DateOfBirth |
Tanggal lahir karyawan |
Eksplisit |
string |
Penjualan |
Penerimaan atau penjualan kotor |
Eksplisit |
number |
Pernyataan_starting_balance |
Saldo di awal periode |
Eksplisit |
number |
Bidang Multi-Nilai
Dalam kasus di mana bidang mungkin berisi beberapa nilai, Anda dapat menentukan array atau tabel.
Daftar Bidang
Untuk bidang yang berisi daftar nilai, Anda dapat menentukan tipe data array.
Dalam contoh ini, "OtherExpenses" didefinisikan sebagai array string, memungkinkan BDA untuk mengekstrak beberapa item pengeluaran untuk bidang itu.

Tabel
Jika dokumen Anda berisi data tabular, Anda dapat menentukan struktur tabel dalam skema.
Dalam contoh ini, “SERVICES_TABLE” didefinisikan sebagai tipe Tabel, dengan bidang kolom seperti nama produk, deskripsi, kuantitas, harga satuan dan jumlah.

Dengan mendefinisikan skema komprehensif dengan deskripsi bidang, tipe data, dan jenis inferensi yang sesuai, Anda dapat memastikan bahwa BDA secara akurat mengekstrak informasi yang diinginkan dari dokumen Anda, terlepas dari variasi dalam pemformatan atau representasi.