Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases

Saat Anda membuat basis pengetahuan dengan menghubungkan ke sumber data, Anda mengatur atau menentukan yang berikut ini:

Informasi umum yang mendefinisikan dan mengidentifikasi basis pengetahuan
Peran layanan dengan izin ke basis pengetahuan.
Konfigurasi untuk basis pengetahuan, termasuk model embeddings yang akan digunakan saat mengonversi data dari sumber data, konfigurasi penyimpanan untuk layanan tempat menyimpan embeddings, dan, secara opsional, lokasi S3 untuk menyimpan data multimodal.

catatan

Anda tidak dapat membuat basis pengetahuan dengan pengguna root. Masuk dengan pengguna IAM sebelum memulai langkah-langkah ini.

Perluas bagian yang sesuai dengan kasus penggunaan Anda:

Untuk mendirikan basis pengetahuan

Masuk ke AWS Management Console menggunakan peran IAM dengan izin Amazon Bedrock, dan buka konsol Amazon Bedrock di. https://console.aws.amazon.com/bedrock/
Di panel navigasi kiri, pilih Basis pengetahuan.
Di bagian Basis pengetahuan, pilih tombol buat dan pilih untuk membuat basis pengetahuan dengan penyimpanan vektor.
(Opsional) Ubah nama default dan berikan deskripsi untuk basis pengetahuan Anda.
Pilih peran AWS Identity and Access Management (IAM) yang memberikan izin Amazon Bedrock untuk mengakses layanan lain yang diperlukan AWS . Anda dapat membiarkan Amazon Bedrock membuat peran layanan atau memilih peran kustom yang telah Anda buat.
Pilih sumber data untuk menghubungkan basis pengetahuan Anda.
(Opsional) Tambahkan tag ke basis pengetahuan Anda. Untuk informasi selengkapnya, lihat Menandai sumber daya Amazon Bedrock.
(Opsional) Konfigurasikan layanan untuk mengirimkan log aktivitas untuk basis pengetahuan Anda.
Pergi ke bagian berikutnya dan ikuti langkah-langkah di Hubungkan sumber data ke basis pengetahuan Anda untuk mengkonfigurasi sumber data.
Di bagian model Embeddings, lakukan hal berikut:
1. Pilih model embeddings untuk mengubah data Anda menjadi embeddings vektor.
2. (Opsional) Perluas bagian Konfigurasi tambahan untuk melihat opsi konfigurasi berikut (tidak semua model mendukung semua konfigurasi):
  - Jenis embeddings — Apakah akan mengonversi data menjadi penyambungan vektor floating-point (float32) (lebih tepat, tetapi lebih mahal) atau embeddings vektor biner (kurang presisi, tetapi lebih murah). Untuk mempelajari tentang model embeddings mana yang mendukung vektor biner, lihat model embeddings yang didukung.
  - Dimensi vektor — Nilai yang lebih tinggi meningkatkan akurasi tetapi meningkatkan biaya dan latensi.
Di bagian database Vector, lakukan hal berikut:
1. Pilih toko vektor untuk menyimpan embeddings vektor yang akan digunakan untuk kueri. Anda memiliki opsi berikut:
  - Cepat buat toko vektor baru - pilih salah satu toko vektor yang tersedia untuk Amazon Bedrock untuk dibuat.
    Amazon OpenSearch Tanpa Server - Pangkalan Pengetahuan Amazon Bedrock membuat koleksi dan indeks pencarian vektor Amazon OpenSearch Tanpa Server dan mengonfigurasinya dengan bidang yang diperlukan untuk Anda.
    
    Amazon Aurora PostgreSQL Tanpa Server — Amazon Bedrock menyiapkan toko vektor Amazon Aurora PostgreSQL Tanpa Server. Proses ini mengambil data teks tidak terstruktur dari bucket Amazon S3, mengubahnya menjadi potongan teks dan vektor, lalu menyimpannya dalam database PostgreSQL. Untuk informasi selengkapnya, lihat Cepat membuat Pangkalan Pengetahuan PostgreSQL Aurora untuk Amazon Bedrock.
    
    Amazon Neptune Analytics — Amazon Bedrock menggunakan teknik Retrieval Augmented Generation (RAG) yang dikombinasikan dengan grafik untuk meningkatkan aplikasi AI generatif sehingga pengguna akhir bisa mendapatkan respons yang lebih akurat dan komprehensif.
  - Pilih penyimpanan vektor yang telah Anda buat — Pilih penyimpanan vektor yang didukung dan identifikasi nama bidang vektor dan nama bidang metadata dalam indeks vektor. Untuk informasi selengkapnya, lihat Prasyarat untuk penyimpanan vektor Anda sendiri untuk basis pengetahuan.
    
    catatan
    Jika sumber data Anda adalah instans Confluence SharePoint, Microsoft, atau Salesforce, satu-satunya layanan penyimpanan vektor yang didukung adalah Amazon Tanpa Server. OpenSearch
2. (Opsional) Perluas bagian Konfigurasi tambahan dan ubah konfigurasi yang relevan.
Jika sumber data Anda berisi gambar, tentukan URI Amazon S3 untuk menyimpan gambar yang akan diekstrak parser dari data di tujuan penyimpanan Multimodal. Gambar dapat dikembalikan selama kueri. Anda juga dapat secara opsional memilih kunci yang dikelola pelanggan alih-alih default Kunci yang dikelola AWS untuk mengenkripsi data Anda.

catatan
Data multimodal hanya didukung dengan Amazon S3 dan sumber data khusus.
Pilih Berikutnya dan tinjau detail basis pengetahuan Anda. Anda dapat mengedit bagian apa pun sebelum melanjutkan dan membuat basis pengetahuan Anda.

catatan
Waktu yang dibutuhkan untuk membuat basis pengetahuan tergantung pada konfigurasi spesifik Anda. Ketika pembuatan basis pengetahuan telah selesai, status basis pengetahuan berubah menjadi keadaan siap atau tersedia.
Setelah basis pengetahuan Anda siap dan tersedia, sinkronkan sumber data Anda untuk pertama kalinya dan kapan pun Anda ingin memperbarui konten Anda. Pilih basis pengetahuan Anda di konsol dan pilih Sinkronkan dalam bagian ikhtisar sumber data.

Untuk membuat basis pengetahuan, kirim CreateKnowledgeBasepermintaan dengan titik akhir waktu pembuatan Agen untuk Amazon Bedrock.

catatan

Jika Anda lebih suka membiarkan Amazon Bedrock membuat dan mengelola penyimpanan vektor untuk Anda, gunakan konsol. Untuk informasi selengkapnya, perluas bagian Gunakan konsol dalam topik ini.

Bidang berikut diperlukan:

Bidang	Deskripsi dasar
name	Nama untuk basis pengetahuan
roleArn	ARN dari peran layanan Pangkalan Pengetahuan Batuan Dasar Amazon.
knowledgeBaseConfiguration	Berisi konfigurasi untuk basis pengetahuan. Lihat detail di bawah ini.
StorageConfiguration	(Hanya diperlukan jika Anda terhubung ke sumber data yang tidak terstruktur).Berisi konfigurasi untuk layanan sumber data yang Anda pilih.

Bidang berikut adalah opsional:

Bidang	Kasus penggunaan
deskripsi	Deskripsi untuk basis pengetahuan.
clientToken	Untuk memastikan permintaan API selesai hanya sekali. Untuk informasi selengkapnya, lihat Memastikan idempotensi.
tag	Untuk mengaitkan tag dengan aliran. Untuk informasi selengkapnya, lihat Menandai sumber daya Amazon Bedrock.

Di knowledgeBaseConfiguration lapangan, yang memetakan ke KnowledgeBaseConfigurationobjek, tentukan VECTOR di type lapangan dan sertakan VectorKnowledgeBaseConfigurationobjek. Dalam objek, sertakan bidang-bidang berikut:

embeddingModelArn— ARN dari model embedding yang akan digunakan.
embeddingModelConfiguration— Konfigurasi untuk model embedding. Untuk melihat kemungkinan nilai yang dapat Anda tentukan untuk setiap model yang didukung, lihatModel dan wilayah yang didukung untuk basis pengetahuan Amazon Bedrock.
(Jika Anda berencana untuk memasukkan data multimodal, yang mencakup gambar, gambar, bagan, atau tabel, dalam basis pengetahuan Anda) supplementalDataStorageConfiguration — Peta ke SupplementalDataStorageLocationobjek, di mana Anda menentukan lokasi S3 untuk menyimpan data yang diekstraksi. Untuk informasi selengkapnya, lihat Opsi penguraian untuk sumber data Anda.

Di storageConfiguration bidang, yang memetakan ke StorageConfigurationobjek, tentukan penyimpanan vektor yang Anda rencanakan untuk terhubung di type lapangan dan sertakan bidang yang sesuai dengan penyimpanan vektor itu. Lihat setiap jenis konfigurasi penyimpanan vektor di StorageConfigurationuntuk detail tentang informasi yang perlu Anda berikan.

Berikut ini menunjukkan contoh permintaan untuk membuat basis pengetahuan yang terhubung ke koleksi Amazon OpenSearch Tanpa Server. Data dari sumber data yang terhubung akan diubah menjadi embeddings vektor biner dengan Amazon Titan Text Embeddings V2 dan data multimodal yang diekstraksi oleh parser diatur untuk disimpan dalam ember yang disebut. MyBucket


PUT /knowledgebases/ HTTP/1.1
Content-type: application/json

{
   "name": "MyKB",
   "description": "My knowledge base",
   "roleArn": "arn:aws:iam::111122223333:role/service-role/AmazonBedrockExecutionRoleForKnowledgeBase_123",
   "knowledgeBaseConfiguration": {
      "type": "VECTOR",
      "vectorKnowledgeBaseConfiguration": { 
         "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.titan-embed-text-v2:0",
         "embeddingModelConfiguration": { 
            "bedrockEmbeddingModelConfiguration": { 
               "dimensions": 1024,
               "embeddingDataType": "BINARY"
            }
         },
         "supplementalDataStorageConfiguration": { 
            "storageLocations": [ 
               { 
                  "s3Location": { 
                     "uri": "arn:aws:s3:::MyBucket"
                  },
                  "type": "S3"
               }
            ]
         }
      }
   },
   "storageConfiguration": { 
      "opensearchServerlessConfiguration": { 
         "collectionArn": "arn:aws:aoss:us-east-1:111122223333:collection/abcdefghij1234567890",
         "fieldMapping": { 
            "metadataField": "metadata",
            "textField": "text",
            "vectorField": "vector"
         },
         "vectorIndexName": "MyVectorIndex"
      }
   }
}

Topik

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Prasyarat untuk menggunakan toko vektor Anda sendiri

Connect sumber data