Opsi penguraian untuk sumber data Anda - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Opsi penguraian untuk sumber data Anda

Parsing mengacu pada interpretasi dokumen dan komponennya yang bermakna. Pangkalan Pengetahuan Amazon Bedrock menawarkan opsi berikut untuk mengurai sumber data Anda selama konsumsi:

  • Parser default Amazon Bedrock — Hanya mem-parsing teks dalam dokumen Anda. Parser ini tidak dikenakan biaya penggunaan apa pun.

  • Amazon Bedrock Data Automation (Pratinjau) — Layanan yang dikelola sepenuhnya yang secara efektif memproses data multimodal, termasuk teks dan gambar, tanpa perlu memberikan permintaan tambahan apa pun. Untuk informasi selengkapnya tentang layanan ini, lihat Amazon Bedrock Data Automation.

  • Model dasar — Memproses data multimodal, termasuk teks dan gambar, menggunakan model dasar atau profil inferensi. Parser ini memberi Anda opsi untuk menyesuaikan prompt yang digunakan untuk ekstraksi data. Biaya parser ini tergantung pada jumlah token yang diproses oleh model foundation. Untuk daftar model yang mendukung penguraian data Pangkalan Pengetahuan Amazon Bedrock, lihat. Model dan Wilayah yang didukung untuk penguraian

catatan

Jika Anda memilih model foundation atau Amazon Bedrock Data Automation untuk parsing dan gagal mengurai file, parser default Amazon Bedrock digunakan sebagai gantinya.

Tabel berikut merangkum dukungan jenis file untuk setiap jenis parser:

Jenis file Ekstensi Pengurai default Otomatisasi Data Batuan Dasar Amazon Model pondasi
Teks biasa (hanya ASCII) .txt Yes Ya Yes Ya Yes Ya
Penurunan harga .md Yes Ya Yes Ya Yes Ya
HyperText Bahasa Markup .html Yes Ya Yes Ya Yes Ya
Dokumen Microsoft Word .doc/.docx Yes Ya Yes Ya Yes Ya
Nilai yang dipisahkan koma .csv Yes Ya Yes Ya Yes Ya
Spreadsheet Microsoft Excel .xls/.xlsx Yes Ya Yes Ya Yes Ya
Format Dokumen Portabel (PDF) .pdf Yes Ya Yes Ya Yes Ya
Gambar - format JPEG/PNG .jpeg, .png No Tidak Yes Ya Yes Ya

Saat memilih cara mengurai data Anda, pertimbangkan hal berikut:

  • Apakah data Anda murni tekstual atau jika berisi data multimodal, seperti gambar, grafik, dan bagan, yang Anda ingin basis pengetahuan dapat kueri.

  • Apakah Anda ingin opsi untuk menyesuaikan prompt yang digunakan untuk menginstruksikan model tentang cara mengurai data Anda.

  • Biaya parser. Untuk informasi selengkapnya, lihat Harga Amazon Bedrock.

Ada batasan untuk jenis file dan total data yang dapat diurai menggunakan parsing lanjutan. Untuk informasi tentang jenis file untuk parsing lanjutan, lihatFormat dan batasan dokumen yang didukung untuk data basis pengetahuan. Untuk informasi tentang total data yang dapat diuraikan menggunakan penguraian lanjutan, lihat titik akhir Amazon Bedrock dan kuota di. Referensi Umum AWS

Untuk mempelajari cara mengonfigurasi cara penguraian basis pengetahuan Anda, lihat konfigurasi sambungan untuk sumber data yang didukung. Hubungkan sumber data ke basis pengetahuan Anda