Buat basis pengetahuan di Amazon Bedrock Knowledge Bases - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat basis pengetahuan di Amazon Bedrock Knowledge Bases

Basis pengetahuan Amazon Bedrock memungkinkan Anda mengintegrasikan informasi kepemilikan ke dalam aplikasi Generative-AI Anda untuk membuat solusi Retrieval Augmented Generation (). RAG Basis pengetahuan mencari data Anda untuk menemukan informasi yang paling berguna dan dapat menggunakannya untuk menjawab pertanyaan bahasa alami.

catatan

Anda tidak dapat membuat basis pengetahuan dengan pengguna root. Masuk dengan IAM pengguna sebelum memulai langkah-langkah ini.

Saat membuat basis pengetahuan, Anda mengatur konfigurasi dan izin basis pengetahuan, memilih sumber data untuk dihubungkan, model penyematan untuk mengonversi data menjadi embeddings, dan penyimpanan vektor untuk menyimpan embed vektor. Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

Console
Untuk mengatur konfigurasi dan izin untuk basis pengetahuan
  1. Masuk ke AWS Management Console menggunakan IAMperan dengan izin Amazon Bedrock, dan buka konsol Amazon Bedrock di. https://console.aws.amazon.com/bedrock/

  2. Di panel navigasi kiri, pilih Basis pengetahuan.

  3. Di bagian Basis pengetahuan, pilih tombol buat.

  4. (Opsional) Ubah nama default dan berikan deskripsi untuk basis pengetahuan Anda.

  5. Pilih peran AWS Identity and Access Management (IAM) yang memberikan izin Amazon Bedrock untuk mengakses AWS layanan lain yang diperlukan. Anda dapat membiarkan Amazon Bedrock membuat peran layanan atau memilih peran kustom yang telah Anda buat.

  6. Pilih sumber data untuk menghubungkan basis pengetahuan Anda.

  7. (Opsional) Tambahkan tag ke basis pengetahuan Anda. Untuk informasi selengkapnya, lihat Menandai sumber daya Amazon Bedrock.

  8. (Opsional) Konfigurasikan layanan untuk mengirimkan log aktivitas untuk basis pengetahuan Anda.

  9. Pergi ke bagian berikutnya dan ikuti langkah-langkah di Hubungkan sumber data ke basis pengetahuan Anda untuk mengkonfigurasi sumber data.

  10. Pilih model embeddings untuk mengubah data Anda menjadi embeddings vektor.

  11. (Opsional) Perluas bagian Konfigurasi tambahan untuk melihat opsi konfigurasi berikut (tidak semua model mendukung semua konfigurasi):

  12. Pilih toko vektor untuk menyimpan embeddings vektor yang akan digunakan untuk kueri. Anda memiliki opsi berikut:

    • Cepat buat toko vektor baru - pilih salah satu toko vektor yang tersedia untuk Amazon Bedrock untuk dibuat.

      • Amazon OpenSearch Tanpa Server - Pangkalan Pengetahuan Amazon Bedrock membuat koleksi dan indeks pencarian vektor Amazon OpenSearch Tanpa Server dan mengonfigurasinya dengan bidang yang diperlukan untuk Anda.

      • Amazon Aurora Postgre Tanpa Server SQL — Amazon Bedrock menyiapkan toko vektor Tanpa Server Amazon Aurora Postgre. SQL Proses ini mengambil data teks tidak terstruktur dari bucket Amazon S3, mengubahnya menjadi potongan teks dan vektor, lalu menyimpannya dalam database Postgre. SQL Untuk informasi selengkapnya, lihat Cepat membuat SQL Pangkalan Pengetahuan Aurora Postgre untuk Amazon Bedrock.

      • Amazon Neptune Analytics — Amazon Bedrock menggunakan teknik Retrieval Augmented Generation RAG () yang dikombinasikan dengan grafik untuk meningkatkan aplikasi AI generatif sehingga pengguna akhir bisa mendapatkan respons yang lebih akurat dan komprehensif.

    • Pilih penyimpanan vektor yang telah Anda buat — Pilih penyimpanan vektor yang didukung dan identifikasi nama bidang vektor dan nama bidang metadata dalam indeks vektor. Untuk informasi selengkapnya, lihat Prasyarat untuk penyimpanan vektor Anda sendiri untuk basis pengetahuan.

      catatan

      Jika sumber data Anda adalah instans Confluence SharePoint, Microsoft, atau Salesforce, satu-satunya layanan penyimpanan vektor yang didukung adalah Amazon Tanpa Server. OpenSearch

  13. Jika sumber data Anda berisi gambar, tentukan Amazon S3 URI untuk menyimpan gambar yang akan diekstrak parser dari data. Gambar dapat dikembalikan selama kueri.

    catatan

    Data multimodal hanya didukung dengan Amazon S3 dan sumber data khusus.

  14. Periksa detail basis pengetahuan Anda. Anda dapat mengedit bagian apa pun sebelum melanjutkan dan membuat basis pengetahuan Anda.

    catatan

    Waktu yang dibutuhkan untuk membuat basis pengetahuan tergantung pada konfigurasi spesifik Anda. Ketika pembuatan basis pengetahuan telah selesai, status basis pengetahuan berubah menjadi keadaan siap atau tersedia.

    Setelah basis pengetahuan Anda siap dan tersedia, sinkronkan sumber data Anda untuk pertama kalinya dan kapan pun Anda ingin memperbarui konten Anda. Pilih basis pengetahuan Anda di konsol dan pilih Sinkronkan dalam bagian ikhtisar sumber data.

API

Untuk membuat basis pengetahuan, kirim CreateKnowledgeBasepermintaan dengan titik akhir waktu pembuatan Agen untuk Amazon Bedrock.

catatan

Jika Anda terhubung ke sumber data yang tidak terstruktur dan Anda lebih suka membiarkan Amazon Bedrock membuat dan mengelola penyimpanan vektor untuk Anda di Amazon OpenSearch Service, gunakan konsol. Untuk informasi selengkapnya, lihat Buat basis pengetahuan di Amazon Bedrock Knowledge Bases.

Bidang berikut diperlukan:

Bidang Deskripsi dasar
name Nama untuk basis pengetahuan
roleArn ARNPeran layanan basis pengetahuan.
knowledgeBaseConfiguration Berisi konfigurasi untuk basis pengetahuan. Lihat detail di bawah ini.
storageConfiguration (Hanya diperlukan jika Anda terhubung ke sumber data yang tidak terstruktur).Berisi konfigurasi untuk layanan sumber data yang Anda pilih.

DiknowledgeBaseConfiguration, tentukan type sumber data yang Anda rencanakan untuk menghubungkan basis pengetahuan dan kemudian tentukan model ARN penyematan yang akan digunakan dan konfigurasi untuknya. Untuk informasi lebih lanjut, lihat VectorKnowledgeBaseConfiguration. Anda dapat menentukan jenis berikut:

  • VECTOR— Untuk sumber data yang tidak terstruktur. Tentukan ARN model penyematan yang akan digunakan dan konfigurasi untuknya. Untuk informasi selengkapnya, lihat VectorKnowledgeBaseConfiguration.

  • STRUCTURED— Untuk penyimpanan data terstruktur. Tentukan jenis penyimpanan data terstruktur yang akan digunakan dan konfigurasi untuk penyimpanan data tersebut.

Bidang berikut adalah opsional:

Bidang Kasus penggunaan
deskripsi Deskripsi untuk basis pengetahuan.
clientToken Untuk memastikan API permintaan selesai hanya sekali. Untuk informasi selengkapnya, lihat Memastikan idempotensi.
tag Untuk mengaitkan tag dengan aliran. Untuk informasi selengkapnya, lihat Menandai sumber daya Amazon Bedrock.

knowledgeBaseConfigurationBidang memetakan ke KnowledgeBaseConfigurationobjek. Di dalamnya, tentukan VECTOR di type lapangan. Dalam VectorKnowledgeBaseConfiguration, tentukan model embedding yang akan digunakan dan konfigurasinya. ARN

storageConfigurationBidang memetakan ke StorageConfigurationobjek. Di dalamnya, tentukan penyimpanan vektor yang Anda rencanakan untuk terhubung di type lapangan dan sertakan bidang yang sesuai dengan penyimpanan vektor itu. Lihat setiap jenis konfigurasi penyimpanan vektor di StorageConfigurationuntuk detail tentang informasi yang perlu Anda berikan.