Cetak Biru - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Cetak Biru

Cetak biru adalah artefak yang dapat Anda gunakan untuk mengonfigurasi logika bisnis pemrosesan file Anda. Setiap cetak biru terdiri dari daftar nama bidang yang dapat Anda ekstrak, format data di mana Anda ingin respons untuk bidang yang akan diekstrak—seperti string, angka, atau boolean—serta konteks bahasa alami untuk setiap bidang yang dapat Anda gunakan untuk menentukan aturan normalisasi dan validasi data. Anda dapat membuat cetak biru untuk setiap kelas dokumen atau gambar yang ingin Anda proses, seperti W2, rintisan pembayaran, atau kartu ID. Blueprints dapat dibuat menggunakan konsol atau API. Setiap cetak biru yang Anda buat adalah AWS sumber daya dengan ID cetak biru dan ARN sendiri.

Saat menggunakan cetak biru untuk ekstraksi, Anda dapat menggunakan cetak biru katalog atau cetak biru yang dibuat khusus. Jika Anda sudah mengetahui jenis dokumen atau gambar yang ingin Anda ekstrak, cetak biru katalog menyediakan tempat awal yang sudah dibuat sebelumnya. Anda dapat membuat cetak biru khusus untuk dokumen dan gambar yang tidak ada dalam katalog. Saat membuat cetak biru, Anda dapat menggunakan beberapa metode, seperti cetak biru yang dihasilkan melalui prompt cetak biru, pembuatan manuel dengan menambahkan bidang individual, atau membuat JSON cetak biru menggunakan Editor JSON. Ini dapat disimpan ke akun Anda dan dibagikan.

Ukuran maksimum cetak biru adalah 100.000 karakter, JSON diformat.

catatan

Saat menggunakan Blueprints, Anda mungkin menemukan diri Anda menggunakan Prompts, baik di bidang atau untuk pembuatan Blueprint. Hanya izinkan sumber tepercaya untuk mengontrol input prompt. Amazon Bedrock tidak bertanggung jawab untuk memvalidasi maksud cetak biru.

Panduan cetak biru

Mari kita ambil contoh dokumen ID seperti paspor dan berjalan melalui cetak biru untuk dokumen ini.

Berikut adalah contoh cetak biru untuk dokumen ID ini yang kita buat di konsol.

Pada intinya, cetak biru adalah struktur data yang berisi bidang, yang pada gilirannya berisi informasi yang diekstraksi oleh output kustom BDA. Ada dua jenis bidang — eksplisit dan implisit — yang terletak di tabel ekstraksi. Ekstraksi eksplisit digunakan untuk informasi yang dinyatakan dengan jelas yang dapat dilihat dalam dokumen. Ekstraksi implisit digunakan untuk informasi yang perlu diubah dari bagaimana mereka muncul dalam dokumen. Misalnya, Anda dapat menghapus tanda hubung dari nomor jaminan sosial, mengonversi dari 111-22-3333 ke 111223333. Bidang berisi komponen dasar tertentu:

  • Nama bidang: Ini adalah nama yang dapat Anda berikan untuk setiap bidang yang ingin Anda ekstrak dari dokumen. Anda dapat menggunakan nama yang Anda gunakan untuk bidang di sistem hilir Anda seperti Place_Birth atauPlace_of_birth.

  • Deskripsi: Ini adalah masukan yang menyediakan konteks bahasa alami untuk setiap bidang dalam cetak biru untuk menggambarkan normalisasi data atau aturan validasi yang harus diikuti. Misalnya, Date of birth in YYYY-MM-DD format atau Is the year of birth before 1992?. Anda juga dapat menggunakan prompt sebagai cara untuk mengulangi cetak biru dan meningkatkan akurasi respons BDA. Memberikan prompt terperinci yang menjelaskan bidang yang Anda butuhkan membantu model yang mendasarinya meningkatkan akurasinya. Prompt mungkin memiliki panjang hingga 300 karakter.

  • Hasil: Informasi yang diekstraksi oleh BDA berdasarkan prompt dan nama bidang.

  • Jenis: Format data yang Anda inginkan respons untuk bidang yang akan digunakan. Kami mendukung string, nomor, boolean, array string, dan array angka.

  • Skor kepercayaan: Persentase kepastian yang dimiliki BDA bahwa ekstraksi Anda akurat.

  • Jenis Ekstraksi: Jenis ekstraksi, baik eksplisit maupun disimpulkan.

  • Nomor Halaman: Halaman mana dari dokumen tempat hasilnya ditemukan.

Selain bidang sederhana, keluaran kustom BDA menawarkan beberapa opsi untuk kasus penggunaan yang mungkin Anda temui dalam ekstraksi dokumen: bidang tabel, grup, dan jenis kustom.

Bidang Tabel

Saat membuat bidang, Anda dapat memilih untuk membuat bidang tabel alih-alih bidang dasar. Anda dapat memberi nama bidang dan memberikan prompt, seperti bidang lainnya. Anda juga dapat menyediakan kolom kolom. Bidang ini memiliki nama kolom, deskripsi kolom, dan jenis kolom. Ketika ditampilkan dalam tabel ekstraksi, bidang tabel memiliki hasil kolom dikelompokkan di bawah nama tabel.

Grup

Grup adalah struktur yang digunakan untuk mengatur beberapa hasil ke dalam satu lokasi dalam ekstraksi Anda. Saat Anda membuat grup, Anda memberi nama grup dan Anda dapat membuat dan menempatkan bidang ke dalam grup tersebut. Grup ini ditandai dalam tabel ekstraksi Anda, dan daftar di bawahnya bidang yang ada di dalam grup.

Jenis kustom

Anda dapat membuat jenis kustom saat mengedit cetak biru di Blueprint Playground. Bidang apa pun bisa menjadi tipe kustom. Jenis ini memiliki nama yang unik, dan meminta pembuatan bidang yang membentuk deteksi. Contohnya adalah membuat tipe khusus yang disebut Alamat, dan termasuk di dalamnya bidang “zip_code”, “city_name”, “street_name”, dan “state”. Kemudian, saat memproses dokumen, Anda dapat menggunakan jenis khusus di bidang “company_address”. Bidang itu kemudian mengembalikan semua informasi, dikelompokkan dalam baris di bawah tipe kustom.