Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Ambil data dan hasilkan respons AI dengan Pangkalan Pengetahuan Amazon Bedrock
<a name="knowledge-base"></a>

Sementara model foundation memiliki pengetahuan umum, Anda dapat lebih meningkatkan responsnya dengan menggunakan Retrieval Augmented Generation (RAG). RAG adalah teknik yang menggunakan informasi dari sumber data untuk meningkatkan relevansi dan akurasi respons yang dihasilkan. Dengan Amazon Bedrock Knowledge Bases, Anda dapat mengintegrasikan informasi kepemilikan ke dalam aplikasi Generative-AI Anda. Ketika kueri dibuat, basis pengetahuan mencari data Anda untuk menemukan informasi yang relevan untuk menjawab kueri. Informasi yang diambil kemudian dapat digunakan untuk meningkatkan respons yang dihasilkan. Anda dapat membangun aplikasi berbasis RAG Anda sendiri dengan menggunakan kemampuan Amazon Bedrock Knowledge Bases.

Dengan Pangkalan Pengetahuan Amazon Bedrock, Anda dapat:
+ Menjawab pertanyaan pengguna dengan mengembalikan informasi yang relevan dari sumber data.
+ Gunakan informasi yang diambil dari sumber data untuk membantu menghasilkan respons yang akurat dan relevan terhadap kueri pengguna.
+ Tingkatkan permintaan Anda sendiri dengan memasukkan informasi relevan yang dikembalikan ke dalam prompt.
+ Sertakan kutipan dalam respons yang dihasilkan sehingga sumber data asli dapat direferensikan dan akurasi dapat diperiksa.
+ Sertakan dokumen dengan sumber daya visual yang banyak, dari mana gambar dapat diekstraksi dan diambil sebagai tanggapan terhadap pertanyaan. Jika Anda menghasilkan respons berdasarkan data yang diambil, model dapat memberikan wawasan tambahan berdasarkan gambar-gambar ini.
+ Cari menggunakan gambar sebagai kueri untuk menemukan konten yang mirip secara visual, atau gabungkan teks dan gambar dalam kueri untuk hasil yang lebih tepat menggunakan model penyematan multimodal.
+ Ubah bahasa alami menjadi kueri (seperti kueri SQL) yang disesuaikan untuk database terstruktur. Kueri ini digunakan untuk mengambil data dari penyimpanan data terstruktur.
+ Perbarui sumber data Anda dan konsumsi perubahan ke basis pengetahuan secara langsung sehingga dapat segera diakses.
+ Gunakan model reranking untuk memengaruhi hasil yang diambil dari sumber data Anda.
+ Sertakan basis pengetahuan dalam alur kerja [Amazon Bedrock Agents](agents.md).

Untuk menyiapkan basis pengetahuan, Anda harus menyelesaikan langkah-langkah umum berikut:

1. (Opsional) Jika Anda menghubungkan basis pengetahuan Anda ke sumber data yang tidak terstruktur, siapkan [penyimpanan vektor Anda sendiri yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html) untuk mengindeks representasi embeddings vektor data Anda. Anda dapat melewati langkah ini jika Anda berencana untuk menggunakan konsol Amazon Bedrock untuk membuat penyimpanan vektor Amazon OpenSearch Tanpa Server untuk Anda.

1. Hubungkan basis pengetahuan Anda ke n sumber data tidak terstruktur atau terstruktur.

1. Sinkronkan sumber data Anda dengan basis pengetahuan Anda.

1. Siapkan aplikasi atau agen Anda untuk melakukan hal berikut:
   + Kueri basis pengetahuan dan kembalikan sumber yang relevan.
   + Kueri basis pengetahuan dan hasilkan respons bahasa alami berdasarkan hasil yang diambil.
   + (Jika Anda menanyakan basis pengetahuan yang terhubung ke penyimpanan data terstruktur) Ubah kueri menjadi kueri khusus bahasa data terstruktur (seperti kueri SQL).

**Topics**
+ [Bagaimana basis pengetahuan bekerja](kb-how-it-works.md)
+ [Model dan Wilayah yang didukung](knowledge-base-supported.md)
+ [Mengobrol dengan dokumen Anda tanpa pengaturan](knowledge-base-chatdoc.md)
+ [Siapkan izin untuk membuat dan mengelola basis pengetahuan](knowledge-base-prereq-permissions-general.md)
+ [Membangun basis pengetahuan dengan menghubungkan ke sumber data](knowledge-base-build.md)
+ [Membangun basis pengetahuan untuk konten multimodal](kb-multimodal.md)
+ [Membangun basis pengetahuan dengan terhubung ke penyimpanan data terstruktur](knowledge-base-build-structured.md)
+ [Bangun basis pengetahuan dengan indeks Amazon Kendra GenAI](knowledge-base-build-kendra-genai-index.md)
+ [Bangun basis pengetahuan dengan grafik Amazon Neptune Analytics](knowledge-base-build-graphs.md)
+ [Uji basis pengetahuan Anda dengan pertanyaan dan tanggapan](knowledge-base-test.md)
+ [Menyebarkan basis pengetahuan Anda untuk aplikasi Anda](knowledge-base-deploy.md)
+ [Melihat informasi tentang basis pengetahuan](kb-info.md)
+ [Memodifikasi basis pengetahuan](kb-update.md)
+ [Hapus basis pengetahuan](kb-delete.md)

# Cara kerja basis pengetahuan Amazon Bedrock
<a name="kb-how-it-works"></a>

Amazon Bedrock Knowledge Bases membantu Anda memanfaatkan Retrieval Augmented Generation (RAG), teknik populer yang melibatkan pengambilan informasi dari penyimpanan data untuk menambah respons yang dihasilkan oleh Large Language Models (). LLMs Saat Anda menyiapkan basis pengetahuan dengan sumber data Anda, aplikasi Anda dapat menanyakan basis pengetahuan untuk mengembalikan informasi guna menjawab kueri baik dengan kutipan langsung dari sumber atau dengan respons alami yang dihasilkan dari hasil kueri.

Dengan Pangkalan Pengetahuan Amazon Bedrock, Anda dapat membangun aplikasi yang diperkaya oleh konteks yang diterima dari kueri basis pengetahuan. Ini memungkinkan waktu yang lebih cepat untuk memasarkan dengan mengabstraksi dari pengangkatan pipa bangunan yang berat dan memberi Anda solusi out-of-the-box RAG untuk mengurangi waktu pembuatan aplikasi Anda. Menambahkan basis pengetahuan juga meningkatkan efektivitas biaya dengan menghilangkan kebutuhan untuk terus melatih model Anda untuk dapat memanfaatkan data pribadi Anda.

Diagram berikut menggambarkan secara skematis bagaimana RAG dilakukan. Basis pengetahuan menyederhanakan pengaturan dan implementasi RAG dengan mengotomatiskan beberapa langkah dalam proses ini.

**Pra-pemrosesan data tidak terstruktur**

Untuk mengaktifkan pengambilan yang efektif dari data pribadi yang tidak terstruktur (data yang tidak ada di penyimpanan data terstruktur), praktik umum adalah mengubah data menjadi teks dan membaginya menjadi potongan-potongan yang dapat dikelola. Potongan atau potongan kemudian dikonversi menjadi embeddings dan ditulis ke indeks vektor, sambil mempertahankan pemetaan ke dokumen asli. Embeddings ini digunakan untuk menentukan kesamaan semantik antara kueri dan teks dari sumber data. Gambar berikut menggambarkan pra-pemrosesan data untuk database vektor.

![\[Data pra-pemrosesan untuk generasi tambahan pengambilan\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/rag-preprocess.png)


Penyematan vektor adalah serangkaian angka yang mewakili setiap potongan teks. Sebuah model mengubah setiap potongan teks menjadi serangkaian angka, yang dikenal sebagai vektor, sehingga teks dapat dibandingkan secara matematis. Vektor-vektor ini dapat berupa bilangan floating-point (float32) atau bilangan biner. Sebagian besar model embeddings yang didukung oleh Amazon Bedrock menggunakan vektor floating-point secara default. Namun, beberapa model mendukung vektor biner. Jika Anda memilih model penyematan biner, Anda juga harus memilih model dan penyimpanan vektor yang mendukung vektor biner.

Vektor biner, yang hanya menggunakan 1 bit per dimensi, tidak semahal penyimpanan seperti vektor floating-point (float32), yang menggunakan 32 bit per dimensi. Namun, vektor biner tidak setepat vektor floating-point dalam representasi teksnya.

Contoh berikut menunjukkan sepotong teks dalam tiga representasi:


****  

| Representasi | Nilai | 
| --- | --- | 
| Teks | “Amazon Bedrock menggunakan model foundation berkinerja tinggi dari perusahaan AI terkemuka dan Amazon.” | 
| vektor Floating-point | [0.041..., 0.056..., -0.018..., -0.012..., -0.020..., ...] | 
| vektor biner | [1,1,0,0,0, ...] | 

**Eksekusi runtime**

Saat runtime, model embedding digunakan untuk mengonversi kueri pengguna menjadi vektor. Indeks vektor kemudian ditanyakan untuk menemukan potongan yang semantik mirip dengan kueri pengguna dengan membandingkan vektor dokumen dengan vektor kueri pengguna. Pada langkah terakhir, prompt pengguna ditambah dengan konteks tambahan dari potongan yang diambil dari indeks vektor. Prompt di samping konteks tambahan kemudian dikirim ke model untuk menghasilkan respons bagi pengguna. Gambar berikut mengilustrasikan bagaimana RAG beroperasi saat runtime untuk menambah respons terhadap kueri pengguna.

![\[Generasi yang diperbesar pengambilan saat runtime\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/rag-runtime.png)


Untuk mempelajari lebih lanjut tentang cara mengubah data Anda menjadi basis pengetahuan, cara menanyakan basis pengetahuan Anda setelah Anda mengaturnya, dan penyesuaian yang dapat Anda terapkan ke sumber data selama proses konsumsi, lihat topik berikut:

**Topics**
+ [Mengubah data menjadi basis pengetahuan](kb-how-data.md)
+ [Mengambil informasi dari sumber data menggunakan Amazon Bedrock Knowledge Bases](kb-how-retrieval.md)
+ [Menyesuaikan basis pengetahuan Anda](kb-how-customization.md)

# Mengubah data menjadi basis pengetahuan
<a name="kb-how-data"></a>

Untuk membuat basis pengetahuan, sambungkan ke sumber data yang didukung yang ingin dapat diakses oleh basis pengetahuan Anda. Basis pengetahuan Anda akan dapat menanggapi pertanyaan pengguna atau menghasilkan tanggapan berdasarkan data yang diambil.

 Amazon Bedrock Knowledge Bases mendukung berbagai dokumen, termasuk teks, gambar, atau dokumen multimodal yang berisi tabel, bagan, diagram, dan gambar lainnya. Data *multimodal* mengacu pada kombinasi teks dan data visual. Contoh jenis file yang berisi data tidak terstruktur adalah teks, penurunan harga, HTML, dan. PDFs

Bagian berikut menjelaskan jenis data yang didukung oleh Pangkalan Pengetahuan Amazon Bedrock dan layanan yang dapat Anda hubungkan dengan basis pengetahuan untuk setiap jenis data:

## Data tidak terstruktur
<a name="kb-how-unstructured"></a>

Data tidak terstruktur mengacu pada data yang tidak dipaksa ke dalam struktur yang telah ditentukan. Pangkalan Pengetahuan Amazon Bedrock mendukung penyambungan ke layanan berikut untuk menambahkan data tidak terstruktur ke basis pengetahuan Anda:
+ Amazon S3
+ Confluence(pratinjau)
+ Microsoft SharePoint(pratinjau)
+ Salesforce(pratinjau)
+ Web Crawler(pratinjau)
+ Sumber data khusus (memungkinkan konsumsi langsung data ke basis pengetahuan tanpa perlu disinkronkan)

Sumber data berisi bentuk mentah dokumen Anda. Untuk mengoptimalkan proses kueri, basis pengetahuan mengubah data mentah Anda menjadi *embeddings vektor*, representasi numerik dari data, untuk mengukur kesamaan dengan kueri yang juga diubah menjadi embeddings vektor. Pangkalan Pengetahuan Amazon Bedrock menggunakan sumber daya berikut dalam proses mengonversi sumber data Anda:
+ Model penyematan — Model dasar yang mengubah data Anda menjadi embeddings vektor. Untuk data multimodal yang berisi teks dan gambar, Anda dapat menggunakan model penyematan multimodal seperti Amazon Titan Multimodal Embeddings G1 atau Cohere Embed v3.
+ Vector store — Layanan yang menyimpan representasi vektor data Anda. Toko vektor berikut didukung:
  + Amazon Tanpa OpenSearch Server
  + Amazon Neptune
  + Amazon Aurora (RDS)
  + Pinecone
  + Redis Enterprise Cloud
  + MongoDB Atlas

*Proses mengubah data Anda menjadi embeddings vektor disebut konsumsi.* Proses konsumsi yang mengubah data Anda menjadi basis pengetahuan melibatkan langkah-langkah berikut:

**Tertelan**

1. Data diuraikan oleh parser pilihan Anda. Untuk informasi lebih lanjut tentang parsing, lihat[Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).

1. Setiap dokumen di sumber data Anda dibagi menjadi *beberapa bagian*, subdivisi data yang dapat ditentukan oleh jumlah token dan parameter lainnya. Untuk informasi lebih lanjut tentang chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)

1. Model penyematan yang Anda pilih mengubah data menjadi embeddings vektor. Untuk konten multimodal, gambar disematkan sebagai vektor visual sementara teks disematkan sebagai vektor teks, memungkinkan pencarian di kedua modalitas.

1. Penyematan vektor ditulis ke indeks vektor di toko vektor pilihan Anda.

Setelah proses konsumsi selesai, basis pengetahuan Anda siap untuk ditanyakan. Untuk informasi tentang cara menanyakan dan mengambil informasi dari basis pengetahuan Anda, lihat[Mengambil informasi dari sumber data menggunakan Amazon Bedrock Knowledge Bases](kb-how-retrieval.md).

Jika Anda membuat perubahan pada sumber data, Anda harus menyinkronkan perubahan untuk menyerap penambahan, modifikasi, dan penghapusan ke dalam basis pengetahuan. Beberapa sumber data mendukung konsumsi langsung atau penghapusan file ke dalam basis pengetahuan, menghilangkan kebutuhan untuk memperlakukan modifikasi dan konsumsi sumber data sebagai langkah terpisah dan kebutuhan untuk selalu melakukan sinkronisasi penuh. Untuk mempelajari cara menyerap dokumen langsung ke basis pengetahuan Anda dan sumber data yang mendukungnya, lihat[Ingest berubah langsung menjadi basis pengetahuan](kb-direct-ingestion.md).

Amazon Bedrock Knowledge Bases menawarkan berbagai opsi untuk menyesuaikan cara data Anda dicerna. Untuk informasi selengkapnya tentang menyesuaikan proses ini, lihat[Menyesuaikan basis pengetahuan Anda](kb-how-customization.md).

## Data terstruktur
<a name="kb-how-structured"></a>

Data terstruktur mengacu pada data tabular dalam format yang telah ditentukan sebelumnya oleh penyimpanan data yang ada di dalamnya. Pangkalan Pengetahuan Amazon Bedrock terhubung ke penyimpanan data terstruktur yang didukung melalui mesin kueri Amazon Redshift. Amazon Bedrock Knowledge Bases menyediakan mekanisme terkelola penuh yang menganalisis pola kueri, riwayat kueri, dan metadata skema untuk mengonversi kueri bahasa alami menjadi kueri SQL. Kueri yang dikonversi ini kemudian digunakan untuk mengambil informasi yang relevan dari sumber data yang didukung.

Amazon Bedrock Knowledge Bases mendukung koneksi ke layanan berikut untuk menambahkan penyimpanan data terstruktur ke basis pengetahuan Anda:
+ Amazon Redshift
+ AWS Glue Data Catalog(AWS Lake Formation)

Jika Anda menghubungkan basis pengetahuan Anda ke penyimpanan data terstruktur, Anda tidak perlu mengubah data menjadi embeddings vektor. Sebagai gantinya, Amazon Bedrock Knowledge Bases dapat langsung menanyakan penyimpanan data terstruktur. Selama kueri, Pangkalan Pengetahuan Amazon Bedrock dapat mengonversi kueri pengguna menjadi kueri SQL untuk mengambil data yang relevan dengan kueri pengguna dan menghasilkan respons yang lebih akurat. Anda juga dapat menghasilkan kueri SQL tanpa mengambil data dan menggunakannya dalam alur kerja lainnya.

Sebagai contoh, repositori database berisi tabel berikut dengan informasi tentang pelanggan dan pembelian mereka:


****  

| ID Pelanggan | Jumlah yang dibeli pada tahun 2020 | Jumlah yang dibeli pada tahun 2021 | Jumlah yang dibeli pada tahun 2022 | Total jumlah yang dibeli hingga saat ini | 
| --- | --- | --- | --- | --- | 
| 1 | 200 | 300 | 500 | 1000 | 
| 2 | 150 | 100 | 120 | 370 | 
| 3 | 300 | 300 | 300 | 900 | 
| 4 | 720 | 180 | 100 | 900 | 
| 5 | 500 | 400 | 100 | 1000 | 
| 6 | 900 | 800 | 1000 | 2700 | 
| 7 | 470 | 420 | 400 | 1290 | 
| 8 | 250 | 280 | 250 | 780 | 
| 9 | 620 | 830 | 740 | 2190 | 
| 10 | 300 | 200 | 300 | 800 | 

Jika kueri pengguna mengatakan “beri saya ringkasan dari 5 pelanggan belanja teratas,” basis pengetahuan dapat melakukan hal berikut:
+ Ubah kueri menjadi kueri SQL.
+ Kembalikan kutipan dari tabel yang berisi berikut ini:
  + Kolom tabel yang relevan “ID Pelanggan” dan “Jumlah Total Pembelian Hingga Saat Ini”
  + Baris tabel yang berisi jumlah total pembelian untuk 10 pelanggan dengan belanja tertinggi
+ Hasilkan respons yang menyatakan pelanggan mana yang merupakan 5 pelanggan belanja teratas dan berapa banyak yang mereka beli.

Contoh lain dari kueri yang basis pengetahuan dapat menghasilkan kutipan tabel untuk meliputi:
+ “5 pelanggan teratas dengan pengeluaran pada tahun 2020"
+ “pelanggan teratas berdasarkan jumlah pembelian pada tahun 2020"
+ “5 pelanggan teratas berdasarkan jumlah pembelian mulai 2020-2022"
+ “5 pelanggan dengan pengeluaran tertinggi di 2020-2022"
+ “pelanggan dengan jumlah pembelian total kurang dari \$110"
+ “5 pelanggan belanja terendah teratas”

Semakin spesifik atau rinci kueri, semakin banyak basis pengetahuan dapat mempersempit informasi yang tepat untuk dikembalikan. Misalnya, alih-alih kueri “10 pelanggan teratas dengan pengeluaran pada tahun 2020", kueri yang lebih spesifik adalah “temukan 10 jumlah total pembelian tertinggi hingga saat ini untuk pelanggan pada tahun 2020". Kueri spesifik mengacu pada nama kolom “Jumlah Total yang Dibeli Sampai Tanggal” di tabel database pengeluaran pelanggan, dan juga menunjukkan bahwa data harus diurutkan berdasarkan “tertinggi”.

# Mengambil informasi dari sumber data menggunakan Amazon Bedrock Knowledge Bases
<a name="kb-how-retrieval"></a>

Setelah menyiapkan basis pengetahuan, Anda dapat mengatur aplikasi Anda untuk menanyakan sumber data di dalamnya. Untuk membuat kueri basis pengetahuan, Anda dapat memanfaatkan operasi API berikut:
+ [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)— Mengambil potongan sumber atau gambar dari data Anda yang paling relevan dengan kueri dan mengembalikannya dalam respons sebagai array.
+ [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)— Bergabung `Retrieve` dengan [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)operasi di Amazon Bedrock untuk mengambil potongan sumber dari data Anda yang paling relevan dengan kueri dan menghasilkan respons bahasa alami. Termasuk kutipan untuk potongan sumber tertentu dari data.  Jika sumber data Anda menyertakan elemen visual, model memanfaatkan wawasan dari gambar-gambar ini saat menghasilkan respons teks dan memberikan atribusi sumber untuk gambar.
+ [GenerateQuery](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerateQuery.html)— Mengubah kueri pengguna bahasa alami menjadi kueri yang dalam bentuk yang cocok untuk penyimpanan data terstruktur.

`RetrieveAndGenerate`Operasi adalah tindakan gabungan yang secara mendasar menggunakan `GenerateQuery`(jika basis pengetahuan Anda terhubung ke penyimpanan data terstruktur), `Retrieve` dan `InvokeModel` untuk melaksanakan seluruh proses RAG. Karena Amazon Bedrock Knowledge Bases juga memberi Anda akses ke `Retrieve` operasi, Anda memiliki fleksibilitas untuk memisahkan langkah-langkah di RAG dan menyesuaikannya untuk kasus penggunaan spesifik Anda.

Anda juga dapat menggunakan [model reranking](rerank.md) saat menggunakan `Retrieve` atau `RetrieveAndGenerate` memutar ulang relevansi dokumen yang diambil selama kueri.

Untuk mempelajari cara menggunakan operasi API ini saat melakukan kueri basis pengetahuan, lihat[Uji basis pengetahuan Anda dengan pertanyaan dan tanggapan](knowledge-base-test.md).

# Menyesuaikan basis pengetahuan Anda
<a name="kb-how-customization"></a>

Pangkalan Pengetahuan Amazon Bedrock menyediakan opsi untuk menyesuaikan cara sumber data Anda diproses menjadi basis pengetahuan Anda, memberi Anda fleksibilitas dalam cara data Anda disimpan, diuraikan, dan dikembalikan ke pengguna akhir. Pilih salah satu topik berikut untuk mempelajari lebih lanjut tentang opsi penyesuaian yang dapat Anda pertimbangkan saat menyiapkan basis pengetahuan Anda:

**Topics**
+ [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
+ [Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md)
+ [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md)
+ [Sertakan metadata dalam sumber data untuk meningkatkan kueri basis pengetahuan](kb-metadata.md)

# Bagaimana content chunking bekerja untuk basis pengetahuan
<a name="kb-chunking"></a>

Saat menelan data Anda, Amazon Bedrock pertama-tama membagi dokumen atau konten Anda menjadi potongan-potongan yang dapat dikelola untuk pengambilan data yang efisien. Potongan kemudian dikonversi menjadi embeddings dan ditulis ke indeks vektor (representasi vektor data), sambil mempertahankan pemetaan ke dokumen asli. Penyematan vektor memungkinkan teks dibandingkan secara kuantitatif.

**Topics**
+ [Chunking standar](#kb-standard-chunking)
+ [Chunking hierarkis](#kb-hiearchical-chunking)
+ [Chunking semantik](#kb-semantic-chunking)
+ [Pembagian konten multimodal](#kb-multimodal-chunking)

## Chunking standar
<a name="kb-standard-chunking"></a>

Amazon Bedrock mendukung pendekatan standar berikut untuk chunking:

**catatan**  
Strategi chunking teks hanya berlaku untuk dokumen teks. Untuk konten multimodal (audio, video, gambar), chunking terjadi pada tingkat model embedding, bukan melalui strategi berbasis teks ini.
+ Potongan ukuran tetap: Anda dapat mengonfigurasi ukuran potongan yang diinginkan dengan menentukan jumlah token per potongan, dan persentase tumpang tindih, memberikan fleksibilitas untuk menyelaraskan dengan kebutuhan spesifik Anda. Anda dapat mengatur jumlah maksimum token yang tidak boleh melebihi potongan dan persentase tumpang tindih antara potongan berturut-turut.
**catatan**  
Untuk konten yang diuraikan (seperti konten yang menggunakan parser lanjutan atau dikonversi dari HTML), Pangkalan Pengetahuan Amazon Bedrock dapat memotong konten untuk mengoptimalkan hasil terbaik. Chunker menghormati batas dokumen logis (seperti halaman atau bagian) dan tidak menggabungkan konten melintasi batas-batas ini, bahkan ketika meningkatkan ukuran token maksimum akan memungkinkan potongan yang lebih besar.
+ Chunking default: Membagi konten menjadi potongan teks sekitar 300 token. Proses chunking menghormati batas-batas kalimat, memastikan bahwa kalimat lengkap dipertahankan dalam setiap potongan.

Anda juga dapat memilih no chunking untuk dokumen Anda. Setiap dokumen diperlakukan satu potongan teks. Anda mungkin ingin pra-proses dokumen Anda dengan membaginya menjadi file terpisah sebelum memilih no chunking sebagai pendekatan/strategi chunking Anda. Jika Anda memilih no chunking untuk dokumen Anda, Anda tidak dapat melihat nomor halaman dalam kutipan atau filter berdasarkan bidang/atribut *x-amz-bedrock-kb- document-page-number* metadata.

## Chunking hierarkis
<a name="kb-hiearchical-chunking"></a>

Chunking hierarkis melibatkan pengorganisasian informasi ke dalam struktur bersarang dari potongan anak dan orang tua. Saat membuat sumber data, Anda dapat menentukan ukuran potongan induk, ukuran potongan anak, dan jumlah token yang tumpang tindih di antara setiap potongan. Selama pengambilan, sistem awalnya mengambil potongan anak, tetapi menggantinya dengan potongan induk yang lebih luas sehingga memberikan model dengan konteks yang lebih komprehensif.

Penyematan teks kecil lebih tepat, tetapi pengambilan bertujuan untuk konteks yang komprehensif. Sistem chunking hierarkis menyeimbangkan kebutuhan ini dengan mengganti potongan anak yang diambil dengan potongan induknya bila sesuai.

**catatan**  
Karena potongan anak digantikan oleh potongan induk selama pengambilan, jumlah hasil yang dikembalikan mungkin kurang dari jumlah yang diminta.
Chunking hierarkis tidak disarankan saat menggunakan bucket vektor S3 sebagai penyimpanan vektor Anda. Saat menggunakan jumlah token yang tinggi untuk chunking (lebih dari 8000 token digabungkan), Anda mungkin mengalami batasan ukuran metadata.

Untuk chunking hierarkis, basis pengetahuan Amazon Bedrock mendukung penetapan dua level atau kedalaman berikut untuk chunking:
+ Induk: Anda mengatur ukuran token potongan induk maksimum.
+ Anak: Anda mengatur ukuran token potongan anak maksimum.

Anda juga mengatur token tumpang tindih antar potongan. Ini adalah jumlah absolut token tumpang tindih antara potongan induk berturut-turut dan potongan anak berturut-turut.

## Chunking semantik
<a name="kb-semantic-chunking"></a>

Chunking semantik adalah teknik pemrosesan bahasa alami yang membagi teks menjadi potongan-potongan yang bermakna untuk meningkatkan pemahaman dan pengambilan informasi. Ini bertujuan untuk meningkatkan akurasi pengambilan dengan berfokus pada konten semantik daripada hanya struktur sintaksis. Dengan demikian, ini dapat memfasilitasi ekstraksi dan manipulasi informasi yang relevan dengan lebih tepat.

Saat mengonfigurasi chunking semantik, Anda memiliki opsi untuk menentukan parameter hiper berikut.
+ Token maksimum: Jumlah maksimum token yang harus dimasukkan dalam satu potongan, sambil menghormati batas kalimat.
+ Ukuran buffer: Untuk kalimat tertentu, ukuran buffer mendefinisikan jumlah kalimat di sekitarnya yang akan ditambahkan untuk pembuatan embeddings. Misalnya, ukuran buffer 1 menghasilkan 3 kalimat (kalimat saat ini, sebelumnya dan berikutnya) untuk digabungkan dan disematkan. Parameter ini dapat mempengaruhi seberapa banyak teks diperiksa bersama untuk menentukan batas setiap potongan, memengaruhi granularitas dan koherensi potongan yang dihasilkan. Ukuran buffer yang lebih besar mungkin menangkap lebih banyak konteks tetapi juga dapat menimbulkan noise, sementara ukuran buffer yang lebih kecil mungkin kehilangan konteks penting tetapi memastikan chunking yang lebih tepat.
+ Ambang batas persentil breakpoint: Ambang batas persentil kalimat distance/dissimilarity untuk menggambar breakpoint antar kalimat. Ambang batas yang lebih tinggi membutuhkan kalimat agar lebih dapat dibedakan agar dapat dibagi menjadi beberapa bagian yang berbeda. Ambang batas yang lebih tinggi menghasilkan potongan yang lebih sedikit dan biasanya ukuran potongan rata-rata yang lebih besar.
**catatan**  
Ada biaya tambahan untuk menggunakan chunking semantik karena penggunaan model pondasi. Biaya tergantung pada jumlah data yang Anda miliki. Lihat [harga Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/) untuk informasi lebih lanjut tentang biaya model pondasi.

## Pembagian konten multimodal
<a name="kb-multimodal-chunking"></a>

Untuk konten multimodal (audio, video, gambar), perilaku chunking berbeda dari dokumen teks:
+ **Penyematan multimodal Nova: Chunking terjadi pada tingkat model embedding**. Anda dapat mengonfigurasi durasi potongan audio dan video dari 1-30 detik (default: 5 detik). Untuk file video, hanya durasi potongan video yang berlaku, meskipun video berisi audio. Durasi potongan audio hanya berlaku untuk file audio mandiri.
+ **Pengurai Otomasi Data Batuan Dasar (BDA):** Konten pertama kali dikonversi menjadi teks (transkrip dan ringkasan adegan), kemudian strategi chunking teks standar diterapkan ke teks yang dikonversi.

**catatan**  
Saat menggunakan penyematan multimodal Nova, strategi chunking teks yang dikonfigurasi di basis pengetahuan Anda hanya memengaruhi dokumen teks di sumber data Anda, bukan file audio, video, atau gambar.

# Opsi penguraian untuk sumber data Anda
<a name="kb-advanced-parsing"></a>

Parsing mengacu pada pemahaman dan ekstraksi konten dari data mentah. Amazon Bedrock Knowledge Bases menawarkan opsi berikut untuk mengurai sumber data Anda selama konsumsi:
+ **Parser default Amazon Bedrock - Hanya mem-parsing** teks dalam file teks, termasuk file.txt, .md, .html, .doc/.docx, .xls/.xlsx, dan.pdf. Parser ini tidak dikenakan biaya penggunaan apa pun.
**catatan**  
Karena parser default hanya mengeluarkan teks, sebaiknya gunakan Amazon Bedrock Data Automation atau model foundation sebagai parser, bukan parser default jika dokumen Anda menyertakan gambar, bagan, tabel, atau gambar. Amazon Bedrock Data Automation dan model foundation dapat mengekstrak elemen-elemen ini dari dokumen Anda dan mengembalikannya sebagai output.
+ Amazon Bedrock Knowledge Bases menawarkan parser berikut untuk mengurai data multimodal, termasuk gambar, bagan, dan tabel dalam file.pdf, selain file gambar.jpeg dan .png. Parser ini juga dapat mengekstrak gambar, bagan, tabel, dan gambar ini dan menyimpannya sebagai file di tujuan S3 yang Anda tentukan selama pembuatan basis pengetahuan. Selama pengambilan basis pengetahuan, file-file ini dapat dikembalikan dalam respons atau atribusi sumber.
  + **Amazon Bedrock Data Automation —** Layanan yang dikelola sepenuhnya yang secara efektif memproses data multimodal, tanpa perlu memberikan permintaan tambahan apa pun. Biaya parser ini tergantung pada jumlah halaman dalam dokumen atau jumlah gambar yang akan diproses. Untuk informasi selengkapnya tentang layanan ini, lihat [Amazon Bedrock Data Automation](bda.md).
  + **Model pondasi** — Memproses data multimodal menggunakan model pondasi. Parser ini memberi Anda opsi untuk menyesuaikan prompt default yang digunakan untuk ekstraksi data. Biaya parser ini tergantung pada jumlah token input dan output yang diproses oleh model foundation. Untuk daftar model yang mendukung penguraian data Pangkalan Pengetahuan Amazon Bedrock, lihat. [Model dan Wilayah yang didukung untuk penguraian](knowledge-base-supported.md#knowledge-base-supported-parsing)

**penting**  
Jika Anda memilih Amazon Bedrock Data Automation atau model foundation sebagai parser, metode yang Anda pilih akan digunakan untuk mengurai semua file.pdf di sumber data Anda, meskipun file.pdf hanya berisi teks. Parser default tidak akan digunakan untuk mengurai file.pdf ini. Akun Anda dikenakan biaya untuk penggunaan Amazon Bedrock Data Automation atau model foundation dalam mengurai file-file ini.

Saat memilih cara mengurai data Anda, pertimbangkan hal berikut:
+ Apakah data Anda murni tekstual atau jika berisi data multimodal, seperti gambar, grafik, dan bagan, yang Anda ingin basis pengetahuan dapat kueri.
+ Apakah Anda ingin opsi untuk menyesuaikan prompt yang digunakan untuk menginstruksikan model tentang cara mengurai data Anda.
+ Biaya parser. Amazon Bedrock Data Automation menggunakan harga per halaman, sedangkan parser model foundation mengenakan biaya berdasarkan token input dan output. Untuk informasi selengkapnya, lihat [Harga Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).
+ Batas ukuran file total. Saat Anda menggunakan model dasar sebagai parser Anda, ukuran file total di semua file tidak boleh lebih besar dari 100 GB.

Untuk mempelajari cara mengonfigurasi cara penguraian basis pengetahuan Anda, lihat konfigurasi sambungan untuk sumber data Anda. [Connect sumber data ke basis pengetahuan Anda](data-source-connectors.md)

# Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna
<a name="kb-custom-transformation"></a>

Anda memiliki kemampuan untuk menentukan fungsi Lambda transformasi khusus untuk menyuntikkan logika Anda sendiri ke dalam proses konsumsi basis pengetahuan.

Anda mungkin memiliki logika chunking tertentu, tidak didukung secara native oleh basis pengetahuan Amazon Bedrock. Gunakan opsi strategi no chunking, sambil menentukan fungsi Lambda yang berisi logika chunking Anda. Selain itu, Anda harus menentukan bucket Amazon S3 agar basis pengetahuan dapat menulis file yang akan dipotong oleh fungsi Lambda Anda.

Setelah chunking, fungsi Lambda Anda akan menulis kembali file yang dipotong ke dalam bucket yang sama dan mengembalikan referensi untuk basis pengetahuan untuk diproses lebih lanjut. Anda secara opsional memiliki kemampuan untuk menyediakan AWS KMS kunci Anda sendiri untuk enkripsi file yang disimpan di bucket S3 Anda.

**catatan**  
Jika konektor web digunakan, teks penurunan harga diteruskan ke Lambda, bukan HTML.

Atau, Anda mungkin ingin menentukan metadata tingkat potongan, sementara basis pengetahuan menerapkan salah satu strategi chunking yang didukung secara asli. Dalam hal ini, pilih salah satu strategi chunking yang telah ditentukan sebelumnya (misalnya, chunking default atau ukuran tetap), sambil memberikan referensi ke fungsi Lambda dan bucket S3 Anda. Dalam hal ini, basis pengetahuan akan menyimpan file yang diuraikan dan dipotong sebelumnya dalam bucket S3 yang telah ditentukan sebelumnya, sebelum memanggil fungsi Lambda Anda untuk menambahkan metadata tingkat potongan lebih lanjut.

Setelah menambahkan metadata tingkat potongan, fungsi Lambda Anda akan menulis kembali file yang dipotong ke dalam bucket yang sama dan mengembalikan referensi untuk basis pengetahuan untuk diproses lebih lanjut. Harap dicatat bahwa metadata tingkat potongan diutamakan dan menimpa metadata tingkat file, jika terjadi tabrakan.

[Untuk contoh penggunaan fungsi Lambda Python untuk chunking kustom, lihat Chunking kustom menggunakan fungsi Lambda.](https://github.com/aws-samples/amazon-bedrock-samples/blob/main/rag/knowledge-bases/features-examples/03-optimizing-accuracy-retrieved-results/advanced_chunking_options.ipynb)

Untuk kontrak API dan file, lihat struktur di bawah ini:

**Kontrak API saat menambahkan transformasi khusus menggunakan fungsi Lambda**

```
{
...
    "vectorIngestionConfiguration": {
        "customTransformationConfiguration": { // Custom transformation 
            "intermediateStorage": {
                "s3Location": { // the location where input/output of the Lambda is expected 
                    "uri": "string"
                }
            },
            "transformations": [{
                "transformationFunction": {
                    "transformationLambdaConfiguration": {
                        "lambdaArn": "string"
                    }
                },
                "stepToApply": "string" // enum of POST_CHUNKING
            }]
        },
        "chunkingConfiguration": {
            "chunkingStrategy": "string",
            "fixedSizeChunkingConfiguration": {
                "maxTokens": "number",
                "overlapPercentage": "number"
            }
            ...
        }
    }
}
```

**Format masukan transformasi Lambda kustom**

```
{
    "version": "1.0",
    "knowledgeBaseId": "string",
    "dataSourceId": "string",
    "ingestionJobId": "string",
    "bucketName": "string",
    "priorTask": "string",
    "inputFiles": [{
        "originalFileLocation": {
            "type": "S3",
            "s3_location": {
                "uri": "string"
            }
        },
        "fileMetadata": {
            "key1": "value1",
            "key2": "value2"
        },
        "contentBatches": [{
            "key":"string"
        }]
    }]
}
```

**Format keluaran transformasi Lambda kustom**

```
{
    "outputFiles": [{
        "originalFileLocation": {
            "type": "S3",
            "s3_location": {
                "uri": "string"
            }
        },
        "fileMetadata": {
            "key1": "value1",
            "key2": "value2"
        },
        "contentBatches": [{
            "key": "string"
        }]
    }]
}
```

**Format file untuk objek yang direferensikan di `fileContents`**

```
{
    "fileContents": [{
        "contentBody": "...",
        "contentType": "string", // enum of TEXT, PDF, ...
        "contentMetadata": {
            "key1": "value1",
            "key2": "value2"
        }
    }
    ...
    ]
}
```

# Sertakan metadata dalam sumber data untuk meningkatkan kueri basis pengetahuan
<a name="kb-metadata"></a>

Saat menelan file CSV (nilai terpisah koma), Anda memiliki kemampuan untuk memiliki basis pengetahuan yang memperlakukan kolom tertentu sebagai bidang konten versus bidang metadata. Alih-alih berpotensi memiliki ratusan atau ribuan pasangan content/metadata file, Anda sekarang dapat memiliki satu file CSV dan file metadata.json yang sesuai, memberikan petunjuk basis pengetahuan tentang cara memperlakukan setiap kolom di dalam CSV Anda.

Ada batasan untuk metadata dokumen fields/attributes per potongan. Lihat [Kuota untuk basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html)

Sebelum menelan file CSV, pastikan:
+ CSV Anda dalam format RFC418 0 dan dikodekan UTF-8.
+ Baris pertama CSV Anda mencakup informasi header.
+ Bidang metadata yang disediakan di metadata.json Anda hadir sebagai kolom di CSV Anda.
+ Anda menyediakan filename.csv.metadata.json file dengan format berikut:

  ```
  {
      "metadataAttributes": {
          "${attribute1}": "${value1}",
          "${attribute2}": "${value2}",
          ...
      },
      "documentStructureConfiguration": {
          "type": "RECORD_BASED_STRUCTURE_METADATA",
          "recordBasedStructureMetadata": {
              "contentFields": [
                  {
                      "fieldName": "string"
                  }
              ],
              "metadataFieldsSpecification": {
                  "fieldsToInclude": [
                      {
                          "fieldName": "string"
                      }
                  ],
                  "fieldsToExclude": [
                      {
                          "fieldName": "string"
                      }
                  ]
              }
          }
      }
  }
  ```

File CSV diurai satu baris pada satu waktu dan strategi chunking dan penyematan vektor diterapkan ke bidang konten. Basis pengetahuan Amazon Bedrock saat ini mendukung satu bidang konten. Bidang konten dibagi menjadi beberapa bagian, dan bidang metadata (kolom) yang terkait dengan setiap potongan diperlakukan sebagai nilai string.

Misalnya, ada CSV dengan kolom 'Description' dan kolom 'Creation\$1Date'. Bidang deskripsi adalah bidang konten dan tanggal pembuatan adalah bidang metadata terkait. Teks deskripsi dibagi menjadi beberapa bagian dan diubah menjadi embeddings vektor untuk setiap baris di CSV. Nilai tanggal pembuatan diperlakukan sebagai representasi string tanggal dan dikaitkan dengan setiap potongan untuk deskripsi.

Jika tidak ada inclusion/exclusion bidang yang disediakan, semua kolom diperlakukan sebagai kolom metadata, kecuali kolom konten. Jika hanya bidang inklusi yang disediakan, hanya kolom yang disediakan yang diperlakukan sebagai metadata. Jika hanya bidang pengecualian yang disediakan, semua kolom, kecuali kolom pengecualian diperlakukan sebagai metadata. Jika Anda memberikan hal yang sama `fieldName` di keduanya `fieldsToInclude` dan`fieldsToExclude`, Amazon Bedrock melempar pengecualian validasi. Jika ada konflik antara inklusi dan pengecualian, itu akan mengakibatkan kegagalan.

Baris kosong yang ditemukan di dalam CSV diabaikan atau dilewati.

# Model dan Wilayah yang didukung untuk basis pengetahuan Amazon Bedrock
<a name="knowledge-base-supported"></a>

Pangkalan Pengetahuan Amazon Bedrock mendukung kueri dengan model dasar berikut:


| Penyedia | Model | ID Model | Dukungan model wilayah tunggal | Dukungan profil inferensi lintas wilayah | 
| --- | --- | --- | --- | --- | 
| AI21 Lab | Jamba 1.5 Besar | ai21.jamba-1-5-besar-v 1:0 |  us-east-1  |  | 
| AI21 Lab | Jamba 1.5 Mini | ai21.jamba-1-5-mini-v 1:0 |  us-east-1  |  | 
| Amazon | Nova Lite | Amazon. nova-lite-v1:0 |  ap-northeast-1 ap-southeast-2 eu-north-1 eu-west-2 us-east-1 us-gov-west-1  |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 ca-sentral-1 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 us-east-1 us-east-2 us-west-2  | 
| Amazon | Nova Mikro | Amazon. nova-micro-v1:0 |  ap-southeast-2 eu-west-2 us-east-1 us-gov-west-1  |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 us-east-1 us-east-2 us-west-2  | 
| Amazon | Nova Pro | Amazon. nova-pro-v1:0 |  ap-southeast-2 eu-west-2 us-east-1 us-gov-west-1  |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 us-east-1 us-east-2 us-west-2  | 
| Antropik | Claude 3 Haiku | anthropic.claude-3-haiku-20240307-v 1:0 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 ca-sentral-1 eu-central-1 eu-central-2 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us-east-1 us-gov-west-1 us-west-2  |  eu-central-1 us-east-2 us-gov-east-1  | 
| Antropik | Claude 3 Soneta | anthropic.claude-3-sonnet-20240229-v 1:0 |  ap-south-1 ap-southeast-2 ca-sentral-1 eu-central-1 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us-east-1 us-west-2  |  ap-northeast-1 ap-northeast-2 ap-southeast-1 eu-central-1  | 
| Antropik | Claude 3.5 Haiku | anthropic.claude-3-5-haiku-20241022-v 1:0 |  us-west-2  |  us-east-1 us-east-2  | 
| Antropik | Claude 3.5 Soneta | anthropic.claude-3-5-sonnet-20240620-v 1:0 |  ap-northeast-1 ap-northeast-2 ap-southeast-1 eu-central-1 eu-central-2 us-east-1 us-gov-west-1 us-west-2  |  ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-gov-east-1 us-west-2  | 
| Antropik | Claude 3.5 Soneta v2 | anthropic.claude-3-5-sonnet-20241022-v 2:0 |  ap-southeast-2 us-west-2  |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 us-east-1 us-east-2  | 
| Antropik | Claude 3.7 Soneta | anthropic.claude-3-7-sonnet-20250219-v 1:0 |  eu-west-2 us-gov-west-1  |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 eu-central-1 eu-north-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-gov-east-1 us-west-2  | 
| Antropik | Claude Opus 4 | anthropic.claude-opus-4-20250514-v 1:0 |  |  us-east-1 us-east-2 us-west-2  | 
| Antropik | Claude Soneta 4 | anthropic.claude-sonnet-4-20250514-v 1:0 |  |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 us-east-1 us-east-2 us-west-2  | 
| Antropik | Claude Soneta 4.5 | anthropic.claude-sonnet-4-5-20250929-v 1:0 | N/A |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ca-sentral-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us-east-1 us-east-2 us-gov-east-1 us-gov-west-1 us-west-2  | 
| Cohere | Perintah R | bersama. command-r-v1:0 |  us-east-1 us-west-2  |  | 
| Cohere | Perintah R \$1 | bersama. command-r-plus-v1:0 |  us-east-1 us-west-2  |  | 
| DeepSeek | DeepSeek-R1 | deepseek.r1-v 1:0 |  |  us-east-1 us-east-2 us-west-2  | 
| Meta | Instruksi Llama 3 70B | b-instruct-vmeta.llama3-70 1:0 |  ap-south-1 ca-central-1 eu-west-2 us-east-1 us-gov-west-1 us-west-2  |  | 
| Meta | Instruksi Llama 3 8B | b-instruct-vmeta.llama3-8 1:0 |  ap-south-1 ca-central-1 eu-west-2 us-east-1 us-gov-west-1 us-west-2  |  | 
| Meta | Instruksi Llama 3.1 405B | b-instruct-vmeta.llama3-1-405 1:0 |  us-west-2  |  us-east-2  | 
| Meta | Instruksi Llama 3.1 70B | b-instruct-vmeta.llama3-1-70 1:0 |  us-west-2  |  us-east-1 us-east-2 us-west-2  | 
| Meta | Instruksi Llama 3.1 8B | b-instruct-vmeta.llama3-1-8 1:0 |  us-west-2  |  us-east-1 us-east-2 us-west-2  | 
| Meta | Instruksi Llama 3.2 11B | b-instruct-vmeta.llama3-2-11 1:0 |  |  us-east-1 us-east-2 us-west-2  | 
| Meta | Instruksi Llama 3.2 90B | b-instruct-vmeta.llama3-2-90 1:0 |  |  us-east-1 us-east-2 us-west-2  | 
| Meta | Instruksi Llama 3.3 70B | b-instruct-vmeta.llama3-3-70 1:0 |  us-east-2  |  us-east-1 us-east-2 us-west-2  | 
| Mistral AI | Mistral Besar (24,02) | mistral.mistral-besar-2402-v 1:0 |  ap-south-1 ap-southeast-2 ca-central-1 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us-east-1 us-west-2  |  | 
| Mistral AI | Mistral Besar (24,07) | mistral.mistral-besar-2407-v 1:0 |  us-west-2  |  | 
| Mistral AI | Mistral Kecil (24.02) | mistral.mistral-kecil-2402-v 1:0 |  us-east-1  |  | 

Amazon Bedrock Knowledge Bases juga mendukung penggunaan profil inferensi untuk mengurai data atau saat menghasilkan respons. Dengan profil inferensi, Anda dapat melacak biaya dan metrik, dan juga melakukan inferensi lintas wilayah untuk mendistribusikan permintaan inferensi model di seluruh kumpulan Wilayah untuk memungkinkan throughput yang lebih tinggi. Anda dapat menentukan profil inferensi dalam [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)permintaan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)atau. Untuk informasi selengkapnya, lihat [Siapkan sumber daya pemanggilan model menggunakan profil inferensi](inference-profiles.md).

**penting**  
Jika Anda menggunakan inferensi lintas wilayah, data Anda dapat dibagikan di seluruh Wilayah.

Anda juga dapat menggunakan model SageMaker AI atau [model khusus](custom-models.md) yang Anda latih pada data Anda sendiri.

**catatan**  
Jika Anda menggunakan SageMaker AI atau model kustom, Anda harus menentukan perintah orkestrasi dan pembuatan (untuk informasi selengkapnya, lihat Templat **prompt basis pengetahuan** di). [Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md) Permintaan Anda harus menyertakan variabel informasi untuk mengakses input dan konteks pengguna.

Dukungan wilayah dan model berbeda untuk beberapa fitur di Pangkalan Pengetahuan Amazon Bedrock. Pilih topik untuk melihat dukungan untuk fitur:

**Topics**
+ [Model yang didukung untuk penyematan vektor](#knowledge-base-supported-embeddings)
+ [Model dan Wilayah yang didukung untuk penguraian](#knowledge-base-supported-parsing)
+ [Model dan Wilayah yang didukung untuk meranking hasil selama kueri](#knowledge-base-supported-rerank)
+ [Wilayah yang Didukung untuk Basis Pengetahuan dengan penyimpanan data terstruktur](#knowledge-base-supported-structured)

## Model yang didukung untuk penyematan vektor
<a name="knowledge-base-supported-embeddings"></a>

Amazon Bedrock Knowledge Bases menggunakan model embedding untuk mengonversi data Anda menjadi embeddings vektor dan menyimpan embeddings dalam database vektor. Untuk informasi selengkapnya, lihat [Mengubah data menjadi basis pengetahuan](kb-how-data.md).

Pangkalan Pengetahuan Amazon Bedrock mendukung penyematan vektor menggunakan model fondasi berikut:


| Penyedia | Model | ID Model | Dukungan model wilayah tunggal | 
| --- | --- | --- | --- | 
| Amazon | Titan Embeddings G1 - Teks | Amazon. titan-embed-text-v1 |  ap-northeast-1 eu-central-1 us-east-1 us-west-2  | 
| Amazon | Penyematan Teks Titan V2 | Amazon. titan-embed-text-v2:0 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-2 ca-sentral-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us-east-1 us-east-2 us-gov-east-1 us-gov-west-1 us-west-2  | 
| Cohere | Sematkan Bahasa Inggris | bersama. embed-english-v3 |  ap-northeast-1 ap-south-1 ap-southeast-1 ap-southeast-2 ca-sentral-1 eu-central-1 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us-east-1 us-west-2  | 
| Cohere | Sematkan Multilingual | bersama. embed-multilingual-v3 |  ap-northeast-1 ap-south-1 ap-southeast-1 ap-southeast-2 ca-sentral-1 eu-central-1 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us-east-1 us-west-2  | 

Model penyematan mendukung jenis vektor berikut.


****  

| Nama model | Jenis vektor yang didukung | Jumlah dimensi yang didukung | 
| --- | --- | --- | 
| Amazon Titan Embeddings G1 - Text | Titik mengambang | 1536 | 
| Embeddings Teks Amazon Titan V2 | Titik mengambang, biner | 256, 512, 1024 | 
| CohereEmbed(Bahasa Inggris) | Titik mengambang, biner | 1024 | 
| CohereEmbed(Multilingual) | Titik mengambang, biner | 1024 | 
| Embeddings Multimodal Amazon Titan G1 | Titik mengambang | 1024 | 
| CohereSematkan v3 (Multimodal) | Titik mengambang, biner | 1024 | 

## Model dan Wilayah yang didukung untuk penguraian
<a name="knowledge-base-supported-parsing"></a>

Saat mengonversi data menjadi embeddings vektor, Anda memiliki opsi berbeda untuk mengurai data Anda di Amazon Bedrock Knowledge Bases. Untuk informasi selengkapnya, lihat [Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).

Berikut daftar dukungan untuk opsi parsing:
+ Pengurai Otomasi Data Batuan Dasar Amazon didukung di AS Barat (Oregon) dan dalam pratinjau dan dapat berubah.
+ Keluarga model pondasi berikut dapat digunakan sebagai parser:
  + Model visi Claude
  + Model visi Nova
  + LLama 4 model penglihatan

  Penguraian model pondasi tersedia di Wilayah AWS s di mana model ini tersedia secara langsung (bukan melalui inferensi lintas wilayah). Untuk ketersediaan model saat ini menurut Wilayah, lihat[Model pondasi yang didukung di Amazon Bedrock](models-supported.md).

## Model dan Wilayah yang didukung untuk meranking hasil selama kueri
<a name="knowledge-base-supported-rerank"></a>

Saat mengambil hasil kueri basis pengetahuan, Anda dapat menggunakan model reranking untuk melakukan rerank ulang hasil dari kueri basis pengetahuan. Untuk informasi selengkapnya, lihat [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) dan [Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md).

Untuk daftar model dan Wilayah yang mendukung reranking, lihat. [Wilayah dan model yang Didukung untuk reranking di Amazon Bedrock](rerank-supported.md)

## Wilayah yang Didukung untuk Basis Pengetahuan dengan penyimpanan data terstruktur
<a name="knowledge-base-supported-structured"></a>

Pangkalan Pengetahuan dengan penyimpanan data terstruktur memungkinkan Anda menghubungkan basis pengetahuan ke penyimpanan data terstruktur dan mengonversi kueri bahasa alami menjadi kueri SQL. Untuk informasi selengkapnya, lihat [Membangun basis pengetahuan dengan terhubung ke penyimpanan data terstruktur](knowledge-base-build-structured.md).

Basis Pengetahuan dengan penyimpanan data terstruktur tersedia sebagai berikutWilayah AWS:
+ Eropa (Frankfurt)
+ Europe (Zurich)
+ Eropa (Irlandia)
+ Eropa (London)
+ Eropa (Paris)
+ Asia Pasifik (Tokyo)
+ Asia Pacific (Seoul)
+ Asia Pacific (Mumbai)
+ Asia Pasifik (Singapura)
+ Asia Pacific (Sydney)
+ Kanada (Pusat)
+ Amerika Selatan (Sao Paulo)
+ AS Timur (Virginia Utara)
+ AS Timur (Ohio)
+ AS Barat (Oregon)
+ AWSGovCloud (AS-Barat)

# Mengobrol dengan dokumen Anda tanpa basis pengetahuan yang dikonfigurasi
<a name="knowledge-base-chatdoc"></a>

Fitur **Obrolan dengan dokumen Anda** di konsol Amazon Bedrock memungkinkan Anda menguji dengan mudah memainkan basis pengetahuan tanpa perlu mengonfigurasi basis pengetahuan. Anda dapat memuat dokumen atau drag-and-drop dokumen di jendela obrolan konsol untuk kemudian mulai mengajukan pertanyaan. **Mengobrol dengan dokumen Anda** menggunakan dokumen Anda untuk menjawab pertanyaan, membuat analisis, membuat ringkasan, merinci bidang dalam daftar bernomor, atau menulis ulang konten. **Mengobrol dengan dokumen Anda** tidak menyimpan dokumen atau datanya setelah digunakan.

**catatan**  
Fitur **Obrolan dengan dokumen Anda** saat ini paling baik didukung dengan model Anthropic Sonnet. Lihat [Model yang didukung untuk basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-supported.html) untuk informasi selengkapnya tentang cara mengakses dan menggunakan model basis pengetahuan.  
Anda tidak dapat menggunakan model reranker saat mengobrol dengan dokumen Anda.

Anda juga dapat dengan mudah membuat prototipe aplikasi obrolan atau aliran tanpa perlu mengkonfigurasi basis pengetahuan. Menggunakan [Amazon Bedrock Studio](https://docs.aws.amazon.com/bedrock/latest/userguide/br-studio.html), Anda dapat mengunggah dokumen dari komputer Anda untuk menyediakan data atau 'sumber data' untuk aplikasi Anda. Amazon Bedrock Studio, berganti nama menjadi Amazon Bedrock IDE, sekarang tersedia di Amazon SageMaker Unified Studio. Untuk informasi selengkapnya, lihat [Amazon Bedrock IDE](https://docs.aws.amazon.com/sagemaker-unified-studio/latest/userguide/bedrock.html).

Untuk menggunakan fitur **Obrolan dengan dokumen Anda** sebagai bagian dari basis pengetahuan, pilih tab di bawah ini dan ikuti langkah-langkahnya.

------
#### [ Console ]

**Untuk mengobrol dengan dokumen Anda di Amazon Bedrock:**

1. Buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock/](https://console.aws.amazon.com/bedrock/).

1. Dari panel navigasi kiri, pilih **Basis pengetahuan** dan pilih **Obrolan dengan dokumen Anda**.

1. Di **tab Obrolan dengan dokumen Anda**, Pilih **Pilih model** di bawah **Model**.

1. Pilih model yang ingin Anda gunakan untuk analisis dokumen dan pilih **Terapkan**.

1. Masukkan prompt sistem pada tab **Obrolan dengan dokumen Anda**.

1. Di bawah **Data** pilih **Komputer Anda** atau **S3**.

1. Pilih **Pilih dokumen** untuk mengunggah dokumen Anda. Anda juga dapat dokumen drag-and-drop di konsol obrolan di kotak yang **bertuliskan Tulis kueri**.
**catatan**  
Jenis file: PDF, MD, TXT, DOC, DOCX, HTML, CSV, XLS, XLSX. Ada batas token tetap yang telah ditetapkan saat menggunakan file di bawah 10MB. File teks berat yang lebih kecil dari 10MB berpotensi lebih besar dari batas token.

1. Masukkan prompt khusus di kotak yang **bertuliskan Tulis kueri**. Anda dapat memasukkan prompt khusus atau menggunakan prompt default. Dokumen yang dimuat dan prompt muncul di bagian bawah jendela obrolan.

1. Pilih **Jalankan**. Respons menghasilkan hasil pencarian dengan opsi **Tampilkan potongan sumber** yang menunjukkan informasi materi sumber untuk jawabannya.

1. Untuk memuat file baru, pilih X untuk menghapus file saat ini yang dimuat ke jendela obrolan dan seret dan lepas dan file baru. Masukkan prompt baru dan pilih **Jalankan**.
**catatan**  
Memilih file baru akan menghapus pertanyaan dan tanggapan sebelumnya dan akan memulai sesi baru.

------

# Menyiapkan izin untuk pengguna atau peran untuk membuat dan mengelola basis pengetahuan
<a name="knowledge-base-prereq-permissions-general"></a>

Agar pengguna atau peran dapat melakukan tindakan yang terkait dengan Pangkalan Pengetahuan Amazon Bedrock, Anda harus melampirkan kebijakan yang memberikan izin untuk melakukan tindakan. Ini menjelaskan izin yang memungkinkan pengguna untuk mengambil informasi dari basis pengetahuan ini dan menghasilkan tanggapan dari mereka.

Perluas bagian berikut untuk mempelajari cara mengatur izin untuk kasus penggunaan tertentu:

## Izinkan peran untuk membuat basis pengetahuan dan mengelolanya
<a name="w2aac28c10c21b7b1"></a>

Untuk memungkinkan peran IAM membuat basis pengetahuan, menghubungkannya ke penyimpanan data terstruktur, mengelola basis pengetahuan, dan memulai dan mengelola pekerjaan konsumsi dari sumber data ke basis pengetahuan, Anda harus memberikan izin untuk,`KnowledgeBase`, `DataSource` dan tindakan. `IngestionJob` Untuk memberikan izin untuk menandai basis pengetahuan, sertakan izin untuk `bedrock:TagResource` dan. `bedrock:UntagResource` 

**catatan**  
Jika pengguna atau peran memiliki kebijakan [AmazonBedrockFullAccess](security-iam-awsmanpol.md#security-iam-awsmanpol-AmazonBedrockFullAccess) AWS terkelola yang dilampirkan, Anda dapat melewati prasyarat ini.

Untuk mengizinkan peran melakukan tindakan ini, lampirkan kebijakan berikut ke peran tersebut:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "CreateKB",
            "Effect": "Allow",
            "Action": [
                "bedrock:CreateKnowledgeBase"
            ],
            "Resource": "*"
        },
        {
            "Sid": "KBDataSourceManagement",
            "Effect": "Allow",
            "Action": [
                "bedrock:GetKnowledgeBase",
                "bedrock:ListKnowledgeBases",
                "bedrock:UpdateKnowledgeBase",
                "bedrock:DeleteKnowledgeBase",
                "bedrock:StartIngestionJob",
                "bedrock:GetIngestionJob",
                "bedrock:ListIngestionJobs",
                "bedrock:StopIngestionJob",
                "bedrock:TagResource",
                "bedrock:UntagResource"
            ],
            "Resource": [
                "arn:aws:bedrock:us-east-1:123456789012:knowledge-base/*"
            ]
        }
    ]
}
```

------

Setelah Anda membuat basis pengetahuan, sebaiknya Anda mencakupkan izin dalam `KBDataSourceManagement` statamen ke bawah dengan mengganti wildcard (*\$1*) dengan ID basis pengetahuan yang Anda buat.

## Izinkan peran untuk melakukan operasi API basis pengetahuan
<a name="w2aac28c10c21b7b3"></a>

Bagian ini menjelaskan izin yang Anda perlukan untuk melakukan operasi `RetrieveAndGenerate` API `Retrieve` dan basis pengetahuan.

Lampirkan kebijakan berikut ke peran:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "GetKB",
            "Effect": "Allow",
            "Action": [
                "bedrock:GetKnowledgeBase"
            ],
            "Resource": [
                "arn:aws:bedrock:us-east-1:123456789012:knowledge-base/${KnowledgeBaseId}"
            ]
        },
        {
            "Sid": "Retrieve",
            "Effect": "Allow",
            "Action": [
                "bedrock:Retrieve"
            ],
            "Resource": [
                "arn:aws:bedrock:us-east-1:123456789012:knowledge-base/${KnowledgeBaseId}"
            ]
        },
        {
            "Sid": "RetrieveAndGenerate",
            "Effect": "Allow",
            "Action": [
                "bedrock:RetrieveAndGenerate"
            ],
            "Resource": [
                "*"
            ]
        }
    ]
}
```

------

Anda dapat menghapus pernyataan yang tidak Anda butuhkan, tergantung pada kasus penggunaan Anda:
+ `GetKB`Pernyataan tersebut digunakan untuk mendapatkan informasi basis pengetahuan.
+ `Retrieve`Pernyataan ini diperlukan untuk menelepon [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)untuk mengambil data dari penyimpanan data Anda.
+ `RetrieveAndGenerate`Pernyataan ini diperlukan untuk memanggil [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)untuk mengambil data dari penyimpanan data Anda dan menghasilkan tanggapan berdasarkan data.

## Minta akses ke model pondasi untuk RetrieveAndGenerate
<a name="knowledge-base-prereq-structured-model-access"></a>

Jika Anda berencana untuk menggunakan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)untuk menghasilkan respons berdasarkan data yang diambil dari sumber data Anda, minta akses ke model dasar yang akan digunakan untuk pembuatan dengan mengikuti langkah-langkah di[Akses model fondasi Amazon Bedrock](model-access.md).

Untuk membatasi izin lebih lanjut, Anda dapat menghilangkan tindakan, atau Anda dapat menentukan sumber daya dan kunci kondisi yang digunakan untuk memfilter izin. Untuk informasi selengkapnya tentang tindakan, sumber daya, dan kunci kondisi, lihat topik berikut di *Referensi Otorisasi Layanan*:
+ [Tindakan yang ditentukan oleh Amazon Bedrock](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-actions-as-permissions) — Pelajari tentang tindakan, jenis sumber daya yang dapat Anda cakupannya di `Resource` bidang, dan kunci kondisi tempat Anda dapat memfilter izin di `Condition` bidang.
+ [Jenis sumber daya yang ditentukan oleh Amazon Bedrock](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-resources-for-iam-policies) — Pelajari tentang jenis sumber daya di Amazon Bedrock.
+ [Kunci kondisi untuk Amazon Bedrock](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-policy-keys) - Pelajari tentang kunci kondisi di Amazon Bedrock.

# Membangun basis pengetahuan dengan menghubungkan ke sumber data
<a name="knowledge-base-build"></a>

Amazon Bedrock Knowledge Bases mendukung berbagai jenis file yang disimpan dalam sumber data. Untuk menafsirkan data dari sumber data, Amazon Bedrock Knowledge Bases memerlukan konversi data menjadi embeddings vektor, representasi numerik dari data. Penyematan ini dapat dibandingkan dengan representasi vektor kueri untuk menilai kesamaan dan menentukan sumber mana yang akan dikembalikan selama pengambilan data.

Menghubungkan basis pengetahuan Anda ke sumber data melibatkan langkah-langkah umum berikut:

1. Hubungkan basis pengetahuan ke sumber data yang didukung.

1. Jika sumber data Anda berisi data multimodal, termasuk file gambar, audio, dan video, Anda harus memilih pendekatan pemrosesan yang sesuai dan model penyematan yang mendukung konten multimodal.
**catatan**  
Data multimodal hanya didukung dengan Amazon S3 dan sumber data khusus. Untuk panduan komprehensif tentang bekerja dengan konten multimodal, lihat[Membangun basis pengetahuan untuk konten multimodal](kb-multimodal.md).

1. Pilih model embeddings untuk mengubah data dalam sumber data menjadi embeddings vektor.

1. Pilih penyimpanan vektor untuk menyimpan representasi vektor data Anda.

1. Sinkronkan data Anda sehingga dikonversi ke embeddings vektor.

1. Jika Anda memodifikasi data di sumber data, Anda harus menyinkronkan ulang perubahannya.

**Topics**
+ [Prasyarat untuk membuat basis pengetahuan Amazon Bedrock dengan sumber data tidak terstruktur](knowledge-base-prereq.md)
+ [Prasyarat dan izin yang diperlukan untuk menggunakan OpenSearch Kluster Terkelola dengan Pangkalan Pengetahuan Amazon Bedrock](kb-osm-permissions-prereq.md)
+ [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md)
+ [Sinkronkan data Anda dengan basis pengetahuan Amazon Bedrock Anda](kb-data-source-sync-ingest.md)
+ [Ingest berubah langsung menjadi basis pengetahuan](kb-direct-ingestion.md)
+ [Lihat informasi sumber data untuk basis pengetahuan Amazon Bedrock Anda](kb-ds-info.md)
+ [Ubah sumber data untuk basis pengetahuan Amazon Bedrock Anda](kb-ds-update.md)
+ [Menghapus sumber data dari basis pengetahuan Amazon Bedrock Anda](kb-ds-delete.md)

# Prasyarat untuk membuat basis pengetahuan Amazon Bedrock dengan sumber data tidak terstruktur
<a name="knowledge-base-prereq"></a>

Basis pengetahuan Amazon Bedrock memerlukan data dan model untuk mengambil dan menghasilkan respons, penyimpanan vektor untuk menyimpan representasi vektor data, dan AWS Identity and Access Management izin untuk mengakses data Anda dan melakukan tindakan.

Sebelum Anda dapat membuat basis pengetahuan, Anda harus memenuhi prasyarat berikut. Untuk persyaratan izin umum, lihat [Menyiapkan izin untuk pengguna atau peran untuk membuat dan mengelola basis pengetahuan](knowledge-base-prereq-permissions-general.md)

1. Pastikan data Anda berada di [konektor sumber data yang didukung](data-source-connectors.md).

1. (Opsional) [Siapkan penyimpanan vektor Anda sendiri yang didukung](knowledge-base-setup.md). Anda dapat melewati langkah ini jika Anda berencana untuk menggunakan Konsol Manajemen AWS untuk secara otomatis membuat penyimpanan vektor untuk Anda.

1. (Opsional) Buat [peran layanan](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_terms-and-concepts.html#iam-term-service-role) kustom AWS Identity and Access Management (IAM) dengan izin yang tepat dengan mengikuti petunjuk di. [Membuat peran layanan untuk Amazon Bedrock Knowledge Bases](kb-permissions.md) Anda dapat menggunakan Konsol Manajemen AWS untuk secara otomatis membuat peran layanan untuk Anda.
**catatan**  
Jika Anda membuat basis pengetahuan dengan Amazon OpenSearch Service (termasuk Amazon OpenSearch Tanpa Server), peran layanan memerlukan izin tambahan selain yang dicakup oleh kebijakan yang dikelola AWS. BedrockFullAccess Ini termasuk`aoss:CreateAccessPolicy`,`iam:CreateServiceLinkedRole`, dan `iam:CreateRole` izin.

1. (Opsional) Siapkan konfigurasi keamanan ekstra dengan mengikuti langkah-langkah di[Enkripsi sumber daya basis pengetahuan](encryption-kb.md).

1. (Opsional) Jika Anda berencana menggunakan operasi [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)API untuk menghasilkan respons berdasarkan informasi yang diambil dari basis pengetahuan Anda, mintalah akses ke model yang akan Anda gunakan di Wilayah tempat Anda akan menggunakannya dengan mengikuti langkah-langkah di[Akses model fondasi Amazon Bedrock](model-access.md).

**Topics**
+ [Prasyarat untuk data basis pengetahuan Amazon Bedrock Anda](knowledge-base-ds.md)
+ [Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan](knowledge-base-setup.md)

# Prasyarat untuk data basis pengetahuan Amazon Bedrock Anda
<a name="knowledge-base-ds"></a>

Sumber data berisi file atau konten dengan informasi yang dapat diambil ketika basis pengetahuan Anda ditanyakan. Anda harus menyimpan dokumen atau konten Anda setidaknya di salah satu [sumber data yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html).

## Format dan batasan dokumen yang didukung untuk data basis pengetahuan
<a name="kb-ds-supported-doc-formats-limits"></a>

Saat Anda terhubung ke [sumber data yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html), konten akan dimasukkan ke dalam basis pengetahuan Anda.

Jika Anda menggunakan Amazon S3 untuk menyimpan file Anda atau sumber data Anda menyertakan file terlampir, maka Anda harus terlebih dahulu memeriksa apakah setiap file dokumen sumber mematuhi hal-hal berikut:
+ File sumber adalah dari format yang didukung berikut:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-ds.html)
+ Setiap ukuran file tidak melebihi kuota 50 MB.

Jika Anda menggunakan Amazon S3 atau sumber data kustom, Anda dapat menggunakan data multimodal, termasuk gambar JPEG (.jpeg) atau PNG (.png) atau file yang berisi tabel, bagan, diagram, atau gambar lainnya.

**catatan**  
Ukuran maksimum file.JPEG dan .PNG adalah 3,75 MB.

# Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan
<a name="knowledge-base-setup"></a>

Untuk menyimpan embeddings vektor tempat dokumen Anda dikonversi, Anda menggunakan penyimpanan vektor. Pangkalan Pengetahuan Amazon Bedrock mendukung alur pembuatan cepat untuk beberapa penyimpanan vektor, jadi jika Anda lebih suka Amazon Bedrock secara otomatis membuat indeks vektor untuk Anda di salah satu penyimpanan vektor tersebut, lewati prasyarat ini dan lanjutkan ke. [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md)

Jika Anda ingin menyimpan embeddings vektor biner alih-alih embeddings vektor floating-point (float32) standar, maka Anda harus menggunakan penyimpanan vektor yang mendukung vektor biner.

**catatan**  
Amazon OpenSearch Serverless dan Amazon OpenSearch Managed cluster adalah satu-satunya penyimpanan vektor yang mendukung penyimpanan vektor biner.

Anda dapat mengatur penyimpanan vektor Anda sendiri yang didukung untuk mengindeks representasi embeddings vektor data Anda. Anda membuat bidang untuk data berikut:
+ Bidang untuk vektor yang dihasilkan dari teks di sumber data Anda dengan model embeddings yang Anda pilih.
+ Bidang untuk potongan teks yang diekstrak dari file di sumber data Anda.
+ Bidang untuk metadata file sumber yang dikelola Amazon Bedrock.
+ (Jika Anda menggunakan database Amazon Aurora dan ingin mengatur [pemfilteran pada metadata) Bidang untuk metadata](kb-test-config.md) yang Anda kaitkan dengan file sumber Anda. Jika Anda berencana untuk mengatur pemfilteran di toko vektor lain, Anda tidak perlu menyiapkan bidang ini untuk pemfilteran.

Anda dapat mengenkripsi toko vektor pihak ketiga dengan kunci KMS. Untuk informasi selengkapnya, lihat [Enkripsi sumber daya basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/encryption-kb.html).

Pilih tab yang sesuai dengan layanan penyimpanan vektor yang akan Anda gunakan untuk membuat indeks vektor Anda.

**catatan**  
Pilihan model embeddings dan dimensi vektor Anda dapat memengaruhi pilihan penyimpanan vektor yang tersedia. Jika Anda tidak dapat menggunakan penyimpanan vektor pilihan Anda, pilih opsi yang kompatibel model embeddings dan dimensi vektor.

------
#### [ Amazon OpenSearch Serverless ]

1. Untuk mengonfigurasi izin dan membuat koleksi pencarian vektor di Amazon OpenSearch Tanpa Server di Konsol Manajemen AWS, ikuti langkah 1 dan 2 di [Bekerja dengan koleksi pencarian vektor di Panduan Pengembang](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vector-search.html) OpenSearch Layanan Amazon. Perhatikan pertimbangan berikut saat menyiapkan koleksi Anda:

   1. Berikan koleksi nama dan deskripsi pilihan Anda.

   1. Untuk membuat koleksi Anda pribadi, pilih **Standard create** for the **Security**. Kemudian, di bagian **Pengaturan akses jaringan**, pilih **VPC** sebagai **jenis Akses** dan pilih titik akhir VPC. Untuk informasi selengkapnya tentang menyiapkan titik akhir VPC untuk koleksi Amazon OpenSearch Tanpa Server, lihat Mengakses [Amazon OpenSearch Tanpa Server menggunakan titik akhir antarmuka ()AWS PrivateLink](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vpc.html) di Panduan Pengembang Layanan Amazon. OpenSearch 

1. Setelah koleksi dibuat, perhatikan **ARN Koleksi** saat Anda membuat basis pengetahuan.

1. Di panel navigasi kiri, pilih **Koleksi di bawah Tanpa** **Server**. Kemudian pilih koleksi pencarian vektor Anda.

1. Pilih tab **Indeks**. Kemudian pilih **Buat indeks vektor**.

1. Di bagian **Detail indeks vektor**, masukkan nama untuk indeks Anda di bidang **nama indeks vektor**.

1. Di bagian **Bidang vektor**, pilih **Tambahkan bidang vektor**. Amazon Bedrock menyimpan embeddings vektor untuk sumber data Anda di bidang ini. Berikan konfigurasi berikut:
   + **Nama bidang vektor** — Berikan nama untuk bidang (misalnya,**embeddings**).
   + **Mesin — Mesin** vektor yang digunakan untuk pencarian. Pilih **Faiss**.
   + **Dimensi** — Jumlah dimensi dalam vektor. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)
   + **Metrik jarak** — Metrik yang digunakan untuk mengukur kesamaan antara vektor. Kami merekomendasikan penggunaan **Euclidean** untuk penyambungan vektor floating-point.

1. Perluas bagian **manajemen Metadata** dan tambahkan dua bidang untuk mengonfigurasi indeks vektor untuk menyimpan metadata tambahan yang dapat diambil oleh basis pengetahuan dengan vektor. Tabel berikut menjelaskan bidang dan nilai yang akan ditentukan untuk setiap bidang:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)

1. Catat nama yang Anda pilih untuk nama indeks vektor, nama bidang vektor, dan nama bidang pemetaan manajemen metadata saat Anda membuat basis pengetahuan. Lalu pilih **Buat**.

Setelah indeks vektor dibuat, Anda dapat melanjutkan untuk [membuat basis pengetahuan Anda](knowledge-base-create.md). Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi yang Anda catat.


| Bidang | Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol) | Bidang yang sesuai dalam pengaturan basis pengetahuan (API) | Deskripsi | 
| --- | --- | --- | --- | 
| Koleksi ARN | Koleksi ARN | CollectionARN | Nama Sumber Daya Amazon (ARN) dari koleksi pencarian vektor. | 
| Nama indeks vektor | Nama indeks vektor | vectorIndexName | Nama indeks vektor. | 
| Nama bidang vektor | Bidang vektor | VectorField | Nama bidang tempat menyimpan embeddings vektor untuk sumber data Anda. | 
| Manajemen metadata (bidang pemetaan pertama) | Bidang teks | TextField | Nama bidang untuk menyimpan teks mentah dari sumber data Anda. | 
| Manajemen metadata (bidang pemetaan kedua) | Bidang metadata yang dikelola batuan dasar | MetaDataField | Nama bidang tempat menyimpan metadata yang dikelola Amazon Bedrock.  | 

Untuk dokumentasi lebih rinci tentang menyiapkan penyimpanan vektor di Amazon OpenSearch Tanpa Server, lihat [Bekerja dengan koleksi pencarian vektor di Panduan](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vector-search.html) Pengembang OpenSearch Layanan Amazon.

------
#### [ Amazon OpenSearch Service Managed Clusters ]

**penting**  
Sebelum menggunakan sumber daya domain apa pun di kluster OpenSearch Terkelola, Anda perlu mengonfigurasi izin dan kebijakan akses IAM tertentu. Untuk informasi selengkapnya, lihat [Prasyarat dan izin yang diperlukan untuk menggunakan OpenSearch Kluster Terkelola dengan Pangkalan Pengetahuan Amazon BedrockIkhtisar konfigurasi izin](kb-osm-permissions-prereq.md).
Jika Anda mengalami kegagalan konsumsi data, ini mungkin menunjukkan kapasitas OpenSearch domain yang tidak mencukupi. Untuk mengatasi masalah ini, tingkatkan kapasitas domain Anda dengan menyediakan IOPS yang lebih tinggi dan dengan meningkatkan pengaturan throughput. Untuk informasi selengkapnya, lihat [Praktik terbaik operasional untuk OpenSearch Layanan Amazon](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/bp.html).

1. Untuk membuat indeks domain dan vektor di OpenSearch Cluster Konsol Manajemen AWS, ikuti langkah-langkah yang dijelaskan dalam [Membuat dan mengelola domain OpenSearch Layanan](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/createupdatedomains.html) di *Panduan Pengembang OpenSearch Layanan Amazon*.

   Perhatikan pertimbangan berikut saat menyiapkan domain Anda:

   1. Berikan nama domain pilihan Anda.

   1. Kami menyarankan Anda menggunakan opsi **Easy create** untuk memulai dengan cepat dengan membuat domain Anda.
**catatan**  
Opsi ini memberi Anda domain dengan throughput rendah. Jika Anda memiliki beban kerja yang lebih besar yang memerlukan throughput lebih tinggi, pilih opsi **Buat Standar**. Anda dapat menyesuaikan kapasitas nanti sesuai kebutuhan. Dengan opsi ini, Anda dapat mulai dengan kapasitas terendah, yang kemudian dapat dimodifikasi nanti sesuai kebutuhan.

   1. Untuk Jaringan, Anda harus memilih **Akses publik**. OpenSearch domain yang berada di belakang VPC tidak didukung untuk Basis Pengetahuan Anda.

   1. Untuk **Versi**, jika Anda menggunakan embeddings vektor biner, Amazon Bedrock Knowledge Bases memerlukan versi Engine 2.16 atau yang lebih baru. Selain itu, versi 2.13 atau lebih tinggi diperlukan untuk membuat indeks k-nn. Untuk informasi selengkapnya, lihat [Penelusuran K-NN](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/knn.html) di panduan *pengembang OpenSearch Layanan Amazon*.

   1. Kami menyarankan Anda menggunakan mode **Dual-stack**.

   1. Kami menyarankan Anda mengaktifkan **kontrol akses berbutir halus** untuk melindungi data di domain Anda, dan lebih lanjut mengontrol izin yang memberikan akses peran layanan basis Pengetahuan Anda ke domain dan membuat permintaan. OpenSearch 

   1. Biarkan semua pengaturan lain ke nilai defaultnya dan pilih **Buat** untuk membuat domain Anda.

1. Setelah domain dibuat, klik untuk mencatat **ARN Domain** dan **titik akhir Domain** saat Anda membuat basis pengetahuan.

1. Setelah membuat domain, Anda dapat membuat indeks vektor dengan menjalankan perintah berikut di OpenSearch dasbor atau menggunakan perintah curl. Lihat informasi yang lebih lengkap dalam [dokumentasi OpenSearch ](https://opensearch.org/docs/latest/search-plugins/knn/knn-index/).

   Saat menjalankan perintah:
   + Berikan nama untuk bidang vektor (misalnya,**embeddings**).
   + Pastikan bahwa vektor yang digunakan untuk pencarian adalah **faiss**. **nmslib** tidak didukung.
   + Untuk jumlah dimensi dalam vektor, lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor:
**catatan**  
Titan V2 Embeddings - Model teks mendukung banyak dimensi. Bisa juga 256 atau 512.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)
   + Anda dapat menambahkan dua bidang untuk mengonfigurasi indeks vektor untuk menyimpan metadata tambahan yang dapat diambil oleh basis pengetahuan dengan vektor. Tabel berikut menjelaskan bidang dan nilai yang akan ditentukan untuk masing-masing bidang.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)

   ```
   PUT /<index-name>
   {
       "settings": {
           "index": {
               "knn": true
           }
       },
       "mappings": {
           "properties": {
               "<vector-name>": {
                   "type": "knn_vector",
                   "dimension": <embedding-dimension>,
                   "data_type": "binary",          # Only needed for binary embeddings
                   "space_type": "l2" | "hamming", # Use l2 for float embeddings and hamming for binary embeddings
                   "method": {
                       "name": "hnsw",
                       "engine": "faiss",
                       "parameters": {
                           "ef_construction": 128,
                           "m": 24
                       }
                   }
               },
   
               "AMAZON_BEDROCK_METADATA": {
                   "type": "text",
                   "index": "false"
               },
               "AMAZON_BEDROCK_TEXT_CHUNK": {
                   "type": "text",
                   "index": "true"            
               }
           }
       }
   }
   ```

1. Catat ARN domain dan titik akhir, dan nama yang Anda pilih untuk nama indeks vektor, nama bidang vektor, dan nama bidang pemetaan manajemen metadata saat Anda membuat basis pengetahuan Anda.

Setelah indeks vektor dibuat, Anda dapat melanjutkan untuk [membuat basis pengetahuan Anda](knowledge-base-create.md). Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi yang Anda catat.


| Bidang | Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol) | Bidang yang sesuai dalam pengaturan basis pengetahuan (API) | Deskripsi | 
| --- | --- | --- | --- | 
| Domain ARN | Domain ARN | DomainARN | Nama Sumber Daya Amazon (ARN) dari domain. OpenSearch | 
| Titik akhir domain | Titik akhir domain | DomainEndPoint | Endpoint untuk terhubung ke OpenSearch domain. | 
| Nama indeks vektor | Nama indeks vektor | vectorIndexName | Nama indeks vektor. | 
| Nama bidang vektor | Bidang vektor | VectorField | Nama bidang tempat menyimpan embeddings vektor untuk sumber data Anda. | 
| Manajemen metadata (bidang pemetaan pertama) | Bidang teks | TextField | Nama bidang untuk menyimpan teks mentah dari sumber data Anda. | 
| Manajemen metadata (bidang pemetaan kedua) | Bidang metadata yang dikelola batuan dasar | MetaDataField | Nama bidang tempat menyimpan metadata yang dikelola Amazon Bedrock.  | 

------
#### [ Amazon S3 Vectors ]

Vektor Amazon S3 menyediakan penyimpanan vektor hemat biaya di Amazon S3 yang dapat digunakan untuk menyimpan dan menanyakan data vektor. Ini menyediakan penyimpanan kumpulan data vektor besar yang tahan lama dan elastis dengan kinerja kueri sub-detik. Vektor Amazon S3 paling cocok untuk beban kerja kueri yang jarang terjadi, dan dapat membantu mengurangi biaya saat digunakan dalam pengambilan augmented generation (RAG) dan aplikasi pencarian semantik.

Vektor Amazon S3 memperkenalkan bucket vektor S3, yang berisi indeks vektor yang dapat Anda kueri berdasarkan makna dan kesamaan semantik. Ini dapat digunakan untuk mengirimkan waktu respons kueri sub-detik dan mengurangi biaya saat menyimpan, mengakses, dan menanyakan data vektor dalam skala besar tanpa menyediakan infrastruktur apa pun. Di dalam bucket vektor, Anda dapat mengatur data vektor Anda dalam indeks vektor. Ember vektor Anda dapat memiliki beberapa indeks vektor. Untuk informasi selengkapnya, lihat [Vektor Amazon S3 di Panduan](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors.html) Pengguna *Amazon* S3.

**catatan**  
Anda dapat membuat basis pengetahuan untuk Vektor Amazon S3 di semua Wilayah AWS tempat Amazon Bedrock dan Amazon S3 Vektor tersedia. *Untuk informasi tentang ketersediaan regional Vektor Amazon S3, lihat Vektor Amazon S3 [di Panduan Pengguna Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors.html).*
Saat menggunakan jumlah token yang sangat tinggi dengan potongan hierarkis di Pangkalan Pengetahuan Batuan Dasar Amazon, Anda dapat melebihi batas ukuran metadata maksimum karena hubungan potongan induk-anak dan konteks hierarkis disimpan sebagai metadata yang tidak dapat difilter di Vektor Amazon S3. Untuk informasi selengkapnya tentang batas ukuran metadata per vektor, lihat [Batasan dan pembatasan](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors-limitations.html) di Panduan Pengguna *Amazon S3*. Untuk informasi tentang strategi chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
<a name="metadata-support"></a>
**Dukungan metadata**  
Anda dapat melampirkan metadata sebagai pasangan nilai kunci ke setiap vektor. Secara default, metadata dapat difilter dan dapat digunakan dalam kueri pencarian kesamaan untuk memfilter berdasarkan kondisi seperti tanggal, kategori, atau preferensi pengguna.

Anda juga dapat mengonfigurasi metadata agar tidak dapat difilter saat membuat indeks vektor. Indeks vektor Amazon S3 mendukung jenis string, boolean, dan nomor.

Saat menggunakan Vektor Amazon S3 dengan Pangkalan Pengetahuan Amazon Bedrock, Anda dapat melampirkan metadata kustom hingga 1 KB (termasuk metadata yang dapat difilter dan tidak dapat difilter) dan 35 kunci metadata per vektor. Untuk informasi selengkapnya tentang batas ukuran metadata per vektor, lihat [Batasan dan pembatasan](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors-limitations.html) di Panduan Pengguna *Amazon S3*.

Jika metadata melebihi batas ini, pekerjaan konsumsi akan memberikan pengecualian saat mengisi indeks vektor. Untuk informasi selengkapnya, lihat [Vektor Amazon S3 di Panduan](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors.html) Pengguna *Amazon* S3.

**Izin yang diperlukan**  
Pastikan kebijakan IAM Anda mengizinkan Amazon Bedrock mengakses indeks vektor Anda di bucket vektor S3. Untuk informasi lebih lanjut tentang izin yang diperlukan, lihat [Membuat peran layanan untuk Amazon Bedrock Knowledge Bases](kb-permissions.md).

**Buat bucket dan indeks vektor S3**  
Untuk menggunakan Vektor Amazon S3 dengan basis pengetahuan Anda, Anda perlu membuat bucket vektor S3 dan indeks vektor. Anda dapat membuat bucket dan indeks vektor menggunakan konsol Amazon S3 AWS CLI, atau AWS SDK. Untuk petunjuk terperinci, lihat [Membuat indeks vektor](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors-index-create.html) di *Panduan Pengguna Amazon S3*.

Perhatikan pertimbangan berikut saat membuat bucket dan indeks vektor di konsol [Amazon S3](https://console.aws.amazon.com/s3/vector-buckets#).

1. Saat membuat bucket vektor S3 Anda, perhatikan pertimbangan berikut.
   + Berikan **nama bucket Vector** yang unik.
   + (Opsional) Amazon S3 akan secara otomatis mengenkripsi data menggunakan enkripsi sisi **Server default dengan kunci terkelola Amazon S3 (SSE-S3**). Anda dapat memilih apakah akan menggunakan enkripsi default ini, atau **enkripsi sisi Server dengan AWS kunci Layanan Manajemen Kunci (SSE-KMS**) sebagai gantinya.
**catatan**  
Jenis enkripsi tidak dapat diubah setelah bucket vektor dibuat.

     Untuk step-by-step petunjuk, lihat [Enkripsi dengan kunci AWS KMS](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors-bucket-encryption.html).

1. Setelah Anda membuat bucket vektor S3, perhatikan **Amazon Resource Name (ARN**) dari bucket vektor saat Anda membuat basis pengetahuan.

1. Pilih bucket vektor yang Anda buat lalu buat indeks vektor. Saat membuat indeks vektor, perhatikan pertimbangan berikut.
   + **Nama indeks vektor** — Berikan nama untuk bidang (misalnya,**embeddings**).
   + **Dimensi** — Jumlah dimensi dalam vektor. Dimensi harus berupa nilai antara 1 dan 4096. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor berdasarkan pilihan model embeddings Anda:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)
   + 
**catatan**  
Vektor Amazon S3 hanya mendukung penyematan floating-point. Penyematan biner tidak didukung.

     **Metrik jarak** — Metrik yang digunakan untuk mengukur kesamaan antara vektor. Anda dapat menggunakan **Cosine** atau **Euclidean**.

1. **Perluas **pengaturan Tambahan** dan berikan metadata yang tidak dapat difilter di bidang metadata Non-Filterable.**

   Anda dapat mengonfigurasi hingga maksimal 10 kunci metadata yang tidak dapat difilter. Pilih **Tambah kunci** dan kemudian tambahkan `AMAZON_BEDROCK_TEXT` dan `AMAZON_BEDROCK_METADATA` sebagai kunci.

1. Di bawah **Enkripsi**, pilih **Tentukan jenis enkripsi**. Anda memiliki opsi untuk **Menggunakan pengaturan bucket untuk enkripsi** atau mengganti pengaturan enkripsi untuk indeks vektor. **Jika Anda mengganti pengaturan tingkat ember, Anda memiliki opsi untuk menentukan jenis enkripsi untuk indeks vektor sebagai enkripsi sisi Server dengan kunci **Layanan Manajemen AWS Kunci (SSE-KMS) atau enkripsi sisi Server default dengan kunci terkelola Amazon S3 (SSE-S3)**.** Untuk informasi selengkapnya tentang pengaturan konfigurasi enkripsi untuk indeks vektor, lihat [Perlindungan data dan enkripsi di Vektor Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors-data-encryption.html).

1. Di bawah **Tag (Opsional)**, Anda dapat menambahkan tag sebagai pasangan nilai kunci untuk membantu melacak dan mengatur biaya indeks vektor menggunakan AWS Billing and Cost Management. Masukkan **Kunci** dan **Nilai**. Untuk menambahkan tag lainnya, pilih **Tambahkan tag**. Anda dapat memasukkan hingga 50 tag untuk indeks vektor. Untuk informasi selengkapnya, lihat [Menggunakan tag dengan indeks vektor Amazon S3](https://docs.aws.amazon.com/console/s3/vector-index-create-with-tag).

1. Buat indeks vektor dan catat **Amazon Resource Name (ARN)** dari indeks vektor saat Anda membuat basis pengetahuan.

**Buat basis pengetahuan untuk bucket vektor S3**  
Setelah mengumpulkan informasi ini, Anda dapat melanjutkan untuk [membuat basis pengetahuan Anda](knowledge-base-create.md). Saat membuat basis pengetahuan Anda dengan bucket vektor S3, Anda harus memberikan ARN bucket vektor dan indeks vektor. Indeks vektor akan menyimpan embeddings yang dihasilkan dari sumber data Anda. Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi:


| Bidang | Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol) | Bidang yang sesuai dalam pengaturan basis pengetahuan (API) | Deskripsi | 
| --- | --- | --- | --- | 
| Ember vektor ARN | Ember vektor S3 ARN | vectorBucketArn | Nama Sumber Daya Amazon (ARN) dari bucket vektor S3 Anda. | 
| Indeks vektor ARN | S3 indeks vektor ARN | VectorIndexARN | Nama Sumber Daya Amazon (ARN) dari indeks vektor untuk bucket vektor S3 Anda. | 

------
#### [ Amazon Aurora (RDS) ]

1. Buat klaster, skema, dan tabel database Amazon Aurora (DB) dengan mengikuti langkah-langkah di Menggunakan [Aurora PostgreSQL](https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/AuroraPostgreSQL.VectorDB.html) sebagai basis pengetahuan. Saat Anda membuat tabel, konfigurasikan dengan kolom dan tipe data berikut. Anda dapat menggunakan nama kolom yang Anda sukai, bukan yang tercantum dalam tabel berikut. Catat nama kolom yang Anda pilih sehingga Anda dapat memberikannya selama pengaturan basis pengetahuan.

   Anda harus menyediakan bidang-bidang ini sebelum membuat basis pengetahuan. Mereka connot diperbarui setelah basis pengetahuan telah dibuat.
**penting**  
Cluster Aurora harus berada Akun AWS sama dengan cluster di mana basis pengetahuan dibuat untuk Amazon Bedrock.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)

1. Anda harus membuat indeks pada vektor kolom dan teks untuk bidang teks dan embeddings Anda. Jika Anda menggunakan bidang metadata kustom, Anda juga harus membuat indeks GIN pada kolom ini. Indeks GIN dapat digunakan untuk secara efisien mencari pasangan nilai kunci dalam dokumen jsonb untuk pemfilteran metadata. *Untuk informasi selengkapnya, lihat [pengindeksan jsonb](https://www.postgresql.org/docs/current/datatype-json.html#JSON-INDEXING) dalam dokumentasi PostgreSQL.*  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)
**catatan**  
Untuk meningkatkan akurasi pencarian hibrida dan latensi dengan konten bahasa Inggris, pertimbangkan untuk menggunakan kamus 'inggris' alih-alih 'sederhana':  

   ```
   CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (to_tsvector('english', chunks));
   ```

1. (Opsional) Jika Anda [menambahkan metadata ke file Anda untuk pemfilteran](kb-test-config.md), kami sarankan Anda memberikan nama kolom di bidang metadata khusus untuk menyimpan semua metadata Anda dalam satu kolom. Selama [konsumsi data](kb-data-source-sync-ingest.md), kolom ini akan diisi dengan semua informasi dalam file metadata dari sumber data Anda. Jika Anda memilih untuk menyediakan bidang ini, Anda harus membuat indeks GIN pada kolom ini.
**catatan**  
Jika Anda sering menggunakan filter rentang di atas metadata numerik, maka untuk mengoptimalkan kinerja, buat indeks untuk kunci tertentu. Misalnya, jika Anda menggunakan filter seperti`"lessThan": { "key": "year", "value": 1989 }`, buat indeks ekspresi pada `year` kunci. Untuk informasi selengkapnya, lihat [Indeks ekspresi dalam dokumentasi](https://www.postgresql.org/docs/current/indexes-expressional.html) *PostgreSQL*.  

   ```
   CREATE INDEX ON your_table ((custom_metadata->>'year')::double precision
   ```

   Atau, jika Anda tidak memberikan nama bidang ini, Anda dapat membuat kolom untuk setiap atribut metadata dalam file Anda dan menentukan tipe data (teks, angka, atau boolean). Misalnya, jika atribut `genre` ada di sumber data Anda, Anda akan menambahkan kolom bernama `genre` dan menentukan `text` sebagai tipe data. Selama [konsumsi data](kb-data-source-sync-ingest.md), kolom terpisah ini akan diisi dengan nilai atribut yang sesuai.

1. Konfigurasikan AWS Secrets Manager rahasia untuk cluster Aurora DB Anda dengan mengikuti langkah-langkah di [Manajemen kata sandi dengan Amazon Aurora](https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/rds-secrets-manager.html) dan. AWS Secrets Manager

1. Catat informasi berikut setelah Anda membuat cluster DB dan mengatur rahasianya.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)

------
#### [ Neptune Analytics graphs (GraphRAG) ]

1. *Untuk membuat penyimpanan grafik dan vektor di Neptunus Analytics di, ikuti langkah-langkah yang dijelaskan dalam Konsol Manajemen AWS[Pengindeksan vektor di Neptunus Analytics di Panduan Pengguna Neptunus](https://docs.aws.amazon.com/neptune-analytics/latest/userguide/vector-index.html) Analytics.*
**catatan**  
Untuk menggunakan Neptune GraphRag, buat grafik Neptunus Analytics kosong dengan indeks pencarian vektor. Indeks pencarian vektor hanya dapat dibuat ketika grafik dibuat. Saat membuat [grafik Neptunus Analytics di](https://docs.aws.amazon.com/neptune-analytics/latest/userguide/create-graph-using-console.html) konsol, Anda menentukan dimensi indeks di **bawah Pengaturan pencarian vektor di** dekat akhir proses.

   Perhatikan pertimbangan berikut saat membuat grafik:

   1. Berikan grafik nama pilihan Anda.

   1. Di bawah **Sumber data**, pilih **Buat grafik kosong**, dan tentukan jumlah m- NCUs yang akan dialokasikan. Setiap m-NCU memiliki sekitar satu GiB kapasitas memori dan komputasi dan jaringan yang sesuai.
**catatan**  
Kapasitas grafik Anda dapat dimodifikasi nanti. Kami menyarankan Anda memulai dengan instance terkecil dan kemudian memilih instance yang berbeda, jika diperlukan.

   1. Anda dapat meninggalkan pengaturan konektivitas jaringan default. Amazon Bedrock akan membuat koneksi jaringan ke grafik Neptunus Analytics yang Anda kaitkan dengan basis pengetahuan. Anda tidak perlu mengonfigurasi konektivitas publik atau titik akhir pribadi untuk grafik Anda.

   1. Di bawah **Pengaturan pencarian vektor****, pilih Gunakan dimensi vektor** dan tentukan jumlah dimensi di setiap vektor.
**catatan**  
Jumlah dimensi di setiap vektor harus sesuai dengan dimensi vektor dalam model embeddings. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)

   1. Biarkan semua pengaturan lain ke default dan buat grafik.

1. Setelah grafik dibuat, klik untuk mencatat **dimensi **ARN Sumber Daya** dan Vektor** saat Anda membuat basis pengetahuan. Saat memilih model embeddings di Amazon Bedrock, pastikan Anda memilih model dengan dimensi yang sama dengan **dimensi Vektor** yang Anda konfigurasikan pada grafik Neptunus Analytics Anda.

Setelah indeks vektor dibuat, Anda dapat melanjutkan untuk [membuat basis pengetahuan Anda](knowledge-base-create.md). Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi yang Anda catat.


| Bidang | Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol) | Bidang yang sesuai dalam pengaturan basis pengetahuan (API) | Deskripsi | 
| --- | --- | --- | --- | 
| Grafik ARN | Grafik Analitik Neptunus ARN | GraphArn | Nama Sumber Daya Amazon (ARN) dari grafik Neptunus Analytics. | 
| Manajemen metadata (bidang pemetaan pertama) | Nama bidang teks | TextField | Nama bidang untuk menyimpan teks mentah dari sumber data Anda. Anda dapat memberikan nilai apa pun untuk bidang ini, misalnya, teks. | 
| Manajemen metadata (bidang pemetaan kedua) | Bidang metadata yang dikelola batuan dasar | MetaDataField | Nama bidang tempat menyimpan metadata yang dikelola Amazon Bedrock. Anda dapat memberikan nilai apa pun untuk bidang ini, misalnya, metadata. | 

------
#### [ Biji pinus ]

**catatan**  
Jika Anda menggunakanPinecone, Anda setuju untuk mengizinkan AWS untuk mengakses sumber pihak ketiga yang ditunjuk atas nama Anda untuk menyediakan layanan penyimpanan vektor kepada Anda. Anda bertanggung jawab untuk mematuhi persyaratan pihak ketiga yang berlaku untuk penggunaan dan dan transfer data dari layanan pihak ketiga.

Untuk dokumentasi mendetail tentang menyiapkan penyimpanan vektorPinecone, lihat Biji [Pinus sebagai basis pengetahuan untuk Amazon Bedrock](https://docs.pinecone.io/docs/amazon-bedrock).

Saat Anda mengatur penyimpanan vektor, perhatikan informasi berikut, yang akan Anda isi saat membuat basis pengetahuan:
+ **Endpoint URL — URL** endpoint untuk halaman manajemen indeks Anda.
+ Rahasia **kredensial ARN —** Nama Sumber Daya Amazon (ARN) dari rahasia yang Anda buat AWS Secrets Manager yang berisi nama pengguna dan kata sandi untuk pengguna database.
+ **(Opsional) Kunci KMS yang dikelola pelanggan untuk ARN rahasia Kredensial Anda — jika Anda mengenkripsi ARN rahasia** kredensil Anda, berikan kunci KMS sehingga Amazon Bedrock dapat mendekripsi itu. 
+ **Nama Space** — (Opsional) Namespace yang akan digunakan untuk menulis data baru ke database Anda. Untuk informasi selengkapnya, lihat [Menggunakan ruang nama](https://docs.pinecone.io/docs/namespaces).

Ada konfigurasi tambahan yang harus Anda berikan saat membuat Pinecone indeks:
+ **Nama bidang teks** - Nama bidang tempat Amazon Bedrock harus menyimpan teks potongan mentah.
+ **Nama bidang metadata — Nama bidang** tempat Amazon Bedrock harus menyimpan metadata atribusi sumber.

Untuk mengakses Pinecone indeks Anda, Anda harus memberikan kunci Pinecone API Anda ke Amazon Bedrock melalui. AWS Secrets Manager

**Untuk menyiapkan rahasia untuk Pinecone konfigurasi Anda**

1. Ikuti langkah-langkah di [Buat AWS Secrets Manager rahasia](https://docs.aws.amazon.com/secretsmanager/latest/userguide/create_secret.html), atur kunci sebagai `apiKey` dan nilai sebagai kunci API untuk mengakses Pinecone indeks Anda.

1. Untuk menemukan kunci API Anda, buka [konsol Pinecone](https://app.pinecone.io/) Anda dan pilih Kunci **API**.

1. Setelah Anda membuat rahasia, perhatikan ARN dari kunci KMS.

1. Lampirkan izin ke peran layanan Anda untuk mendekripsi ARN kunci KMS dengan mengikuti langkah-langkahnya. [Izin untuk mendekripsi AWS Secrets Manager rahasia untuk penyimpanan vektor yang berisi basis pengetahuan Anda](encryption-kb.md#encryption-kb-3p)

1. Kemudian, ketika Anda membuat basis pengetahuan Anda, masukkan ARN di bidang ARN **rahasia Kredensial.**

------
#### [ Awan Perusahaan Redis ]

**catatan**  
Jika Anda menggunakanRedis Enterprise Cloud, Anda setuju untuk mengizinkan AWS untuk mengakses sumber pihak ketiga yang ditunjuk atas nama Anda untuk menyediakan layanan penyimpanan vektor kepada Anda. Anda bertanggung jawab untuk mematuhi persyaratan pihak ketiga yang berlaku untuk penggunaan dan transfer data dari layanan pihak ketiga.

Untuk dokumentasi mendetail tentang menyiapkan penyimpanan vektorRedis Enterprise Cloud, lihat [Mengintegrasikan Redis Enterprise Cloud dengan Amazon Bedrock](https://docs.redis.com/latest/rc/cloud-integrations/aws-marketplace/aws-bedrock/).

Saat Anda mengatur penyimpanan vektor, perhatikan informasi berikut, yang akan Anda isi saat membuat basis pengetahuan:
+ **Endpoint URL — URL** endpoint publik untuk database Anda.
+ **Nama indeks vektor** — Nama indeks vektor untuk database Anda.
+ **Bidang vektor** — Nama bidang tempat penyematan vektor akan disimpan. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/knowledge-base-setup.html)
+ **Bidang teks** — Nama bidang tempat Amazon Bedrock menyimpan potongan teks mentah.
+ Bidang **metadata yang dikelola oleh batuan dasar — Nama bidang** tempat Amazon Bedrock menyimpan metadata yang terkait dengan basis pengetahuan Anda.

Untuk mengakses Redis Enterprise Cloud klaster Anda, Anda harus menyediakan konfigurasi Redis Enterprise Cloud keamanan Anda ke Amazon Bedrock melalui file. AWS Secrets Manager

**Untuk menyiapkan rahasia untuk Redis Enterprise Cloud konfigurasi Anda**

1. Aktifkan TLS untuk menggunakan database Anda dengan Amazon Bedrock dengan mengikuti langkah-langkah di [Transport Layer Security (TLS](https://docs.redis.com/latest/rc/security/database-security/tls-ssl/)).

1. Ikuti langkah-langkah di [Buat AWS Secrets Manager rahasia](https://docs.aws.amazon.com/secretsmanager/latest/userguide/create_secret.html). Siapkan kunci berikut dengan nilai yang sesuai dari Redis Enterprise Cloud konfigurasi Anda secara rahasia:
   + `username`— Nama pengguna untuk mengakses Redis Enterprise Cloud database Anda. Untuk menemukan nama pengguna Anda, lihat di bawah bagian **Keamanan** database Anda di [Konsol Redis](http://app.redislabs.com/).
   + `password`— Kata sandi untuk mengakses Redis Enterprise Cloud database Anda. Untuk menemukan kata sandi Anda, lihat di bawah bagian **Keamanan** database Anda di [Konsol Redis](http://app.redislabs.com/).
   + `serverCertificate`— Isi sertifikat dari otoritas Redis Cloud Certificate. Unduh sertifikat server dari Konsol Admin Redis dengan mengikuti langkah-langkah di [Unduh sertifikat](https://docs.redis.com/latest/rc/security/database-security/tls-ssl/#download-certificates).
   + `clientPrivateKey`— Kunci pribadi sertifikat dari otoritas Redis Cloud Certificate. Unduh sertifikat server dari Konsol Admin Redis dengan mengikuti langkah-langkah di [Unduh sertifikat](https://docs.redis.com/latest/rc/security/database-security/tls-ssl/#download-certificates).
   + `clientCertificate`— Kunci publik sertifikat dari otoritas Redis Cloud Certificate. Unduh sertifikat server dari Konsol Admin Redis dengan mengikuti langkah-langkah di [Unduh sertifikat](https://docs.redis.com/latest/rc/security/database-security/tls-ssl/#download-certificates).

1. Setelah Anda membuat rahasia, perhatikan ARN-nya. Kemudian, ketika Anda membuat basis pengetahuan Anda, masukkan ARN di bidang ARN **rahasia Kredensial.**

------
#### [ MongoDB Atlas ]

**catatan**  
Jika Anda menggunakan MongoDB Atlas, Anda setuju untuk AWS mengizinkan untuk mengakses sumber pihak ketiga yang ditunjuk atas nama Anda untuk menyediakan layanan penyimpanan vektor kepada Anda. Anda bertanggung jawab untuk mematuhi persyaratan pihak ketiga yang berlaku untuk penggunaan dan dan transfer data dari layanan pihak ketiga.

Untuk dokumentasi mendetail tentang menyiapkan penyimpanan vektor di MongoDB Atlas, [lihat Meluncurkan Alur Kerja RAG yang Dikelola Sepenuhnya Dengan Atlas MongoDB](https://www.mongodb.com/developer/products/atlas/rag-workflow-with-atlas-amazon-bedrock/) dan Amazon Bedrock.

Saat Anda mengatur penyimpanan vektor, perhatikan informasi berikut yang akan Anda tambahkan saat Anda membuat basis pengetahuan:
+ URL **Endpoint — URL** endpoint dari cluster MongoDB Atlas Anda.
+ **Nama database** — Nama database di cluster MongoDB Atlas Anda.
+ **Nama koleksi** — Nama koleksi dalam database Anda.
+ Rahasia **kredensial ARN -** Nama Sumber Daya Amazon (ARN) dari rahasia yang Anda buat AWS Secrets Manager yang berisi nama pengguna dan kata sandi untuk pengguna database di cluster MongoDB Atlas Anda. Rahasianya harus berisi kunci bernama `username` dan`password`.
+ **(Opsional) Kunci KMS yang dikelola pelanggan untuk ARN rahasia Kredensial Anda — jika Anda mengenkripsi ARN rahasia** kredensil Anda, berikan kunci KMS sehingga Amazon Bedrock dapat mendekripsi itu. 

Ada konfigurasi tambahan untuk **pemetaan Field** yang harus Anda berikan saat membuat indeks MongoDB Atlas:
+ **Nama indeks vektor** — Nama Indeks Pencarian Vektor MongoDB Atlas pada koleksi Anda.
+ **Nama bidang vektor** — Nama bidang tempat Amazon Bedrock harus menyimpan embeddings vektor.
+ **Nama bidang teks** - Nama bidang tempat Amazon Bedrock harus menyimpan teks potongan mentah.
+ **Nama bidang metadata — Nama bidang** tempat Amazon Bedrock harus menyimpan metadata atribusi sumber.
+ **(Opsional) Nama indeks pencarian teks** — Nama indeks MongoDB Atlas Search pada koleksi Anda.

**penting**  
Jika Anda berencana untuk menggunakan pemfilteran metadata dengan basis pengetahuan MongoDB Atlas Anda, Anda harus mengonfigurasi filter secara manual dalam indeks vektor Anda. Pemfilteran metadata tidak berfungsi secara default dan memerlukan pengaturan tambahan dalam konfigurasi indeks vektor MongoDB Atlas Anda.

(Opsional) Agar Amazon Bedrock terhubung ke cluster AWS PrivateLink MongoDB Atlas Anda, lihat [alur kerja RAG dengan](https://www.mongodb.com/developer/products/atlas/rag-workflow-with-atlas-amazon-bedrock/) MongoDB Atlas menggunakan Amazon Bedrock.

------

# Prasyarat dan izin yang diperlukan untuk menggunakan OpenSearch Kluster Terkelola dengan Pangkalan Pengetahuan Amazon Bedrock
<a name="kb-osm-permissions-prereq"></a>

Bagian ini menunjukkan cara mengonfigurasi izin jika Anda membuat database vektor sendiri dengan Amazon OpenSearch Service Managed Clusters. Konfigurasi ini harus dilakukan sebelum Anda membuat basis pengetahuan. Langkah-langkahnya mengasumsikan bahwa Anda telah membuat indeks domain dan vektor di Amazon OpenSearch Service. Untuk informasi selengkapnya, lihat [Membuat dan mengelola domain OpenSearch Layanan](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/createupdatedomains.html) di *panduan pengembang OpenSearch Layanan Amazon*.

## Pertimbangan utama
<a name="kb-osm-permissions-prereq-considerations"></a>

Berikut ini adalah beberapa pertimbangan utama untuk menggunakan Pangkalan Pengetahuan Amazon Bedrock dengan Amazon OpenSearch Service Managed Clusters.
+ Sebelum menggunakan sumber daya domain apa pun di kluster OpenSearch Terkelola, Anda perlu mengonfigurasi izin dan kebijakan akses IAM tertentu. Untuk integrasi Pangkalan Pengetahuan dengan kluster Terkelola, sebelum Anda melakukan langkah-langkah di bagian ini, jika domain Anda memiliki kebijakan akses terbatas, Anda harus memberikan akses IAM yang diperlukan dan mengonfigurasi kebijakan berbasis sumber daya. Kami juga menyarankan Anda mengonfigurasi kontrol akses berbutir halus untuk mengurangi izin.
+ Saat menelan data untuk basis pengetahuan Anda, jika Anda mengalami kegagalan, itu mungkin menunjukkan kapasitas OpenSearch domain yang tidak memadai untuk menangani kecepatan konsumsi. Untuk mengatasi masalah ini, tingkatkan kapasitas domain Anda dengan menyediakan IOPS (Operasi Input/Output Per Detik) yang lebih tinggi dan dengan meningkatkan pengaturan throughput. Tunggu beberapa menit hingga kapasitas baru disediakan dan kemudian coba lagi proses konsumsi. Untuk memverifikasi bahwa masalah telah teratasi, Anda dapat memantau kinerja selama proses coba lagi. Jika pelambatan masih berlanjut, Anda mungkin perlu menyesuaikan kapasitas lebih lanjut untuk meningkatkan efisiensi. Untuk informasi selengkapnya, lihat [Praktik terbaik operasional untuk OpenSearch Layanan Amazon](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/bp.html).

## Ikhtisar konfigurasi izin
<a name="kb-osm-permissions-prereq-overview"></a>

Untuk integrasi Pangkalan Pengetahuan dengan kluster terkelola, Anda perlu mengonfigurasi izin akses IAM berikut dan kebijakan berbasis sumber daya. Kami menyarankan Anda mengaktifkan kebijakan akses berbutir halus untuk lebih mengontrol akses pengguna dan perincian yang harus dicakup hingga ke tingkat properti.

Langkah-langkah berikut memberikan ikhtisar tingkat tinggi tentang cara mengonfigurasi izin.

1. 

**Membuat dan menggunakan peran layanan basis Pengetahuan**

   Untuk izin yang ingin Anda konfigurasikan, sementara Anda masih dapat memberikan peran kustom Anda sendiri, kami sarankan Anda menentukan opsi untuk Pangkalan Pengetahuan Amazon Bedrock untuk membuat peran layanan basis Pengetahuan untuk Anda.

1. 

**Konfigurasikan kebijakan berbasis sumber daya**

    OpenSearch Domain mendukung kebijakan berbasis sumber daya, yang menentukan prinsipal mana yang dapat mengakses dan bertindak pada domain. Untuk digunakan dengan Pangkalan Pengetahuan, pastikan konfigurasi yang tepat dari kebijakan berbasis sumber daya untuk domain Anda.

1. 

***(Sangat Disarankan)* Menyediakan pemetaan peran untuk kontrol akses berbutir halus**

   Meskipun kontrol akses berbutir halus bersifat opsional, kami menyarankan Anda mengaktifkannya untuk mengontrol perincian di mana izin harus dicakup di tingkat properti.

## Mengonfigurasi kebijakan IAM
<a name="kb-osm-permissions-iam"></a>

Kebijakan akses domain Anda harus memberikan izin untuk melakukan tindakan OpenSearch API yang diperlukan berdasarkan peran di akun Anda.

Jika domain Anda memiliki kebijakan akses terbatas, maka domain tersebut mungkin perlu diperbarui sebagai berikut:
+ Ini harus memberikan akses ke layanan Amazon Bedrock dan menyertakan tindakan HTTP yang diperlukan:`GET`,, `POST``PUT`, dan`DELETE`.
+ Itu juga harus memberikan izin Amazon Bedrock untuk melakukan `es:DescribeDomain` tindakan pada sumber daya indeks Anda. Hal ini memungkinkan Amazon Bedrock Knowledge Bases untuk melakukan validasi yang diperlukan saat mengonfigurasi basis pengetahuan.

## (Opsional) Kontrol akses berbutir halus
<a name="kb-osm-permissions-console-fgap"></a>

Kontrol akses berbutir halus dapat mengontrol perincian di mana izin harus dicakup di tingkat propertiAnda dapat mengonfigurasi kebijakan akses berbutir halus, untuk memberikan izin baca-tulis yang diperlukan untuk peran layanan yang dibuat oleh Pangkalan Pengetahuan.

Untuk mengonfigurasi kontrol akses berbutir halus dan menyediakan pemetaan peran:

1. Pastikan OpenSearch domain yang Anda buat telah mengaktifkan kontrol akses berbutir halus.

1. Buat OpenSearch UI (Dasbor), jika Anda belum melakukannya. Ini akan digunakan untuk mengkonfigurasi pemetaan peran

1. Di OpenSearch Dasbor Anda, buat OpenSearch peran dan tentukan nama indeks vektor, serta izin cluster dan indeks. Untuk menambahkan izin, Anda harus membuat grup izin dan kemudian menambahkan izin yang diperlukan yang memberikan akses untuk melakukan serangkaian operasi termasuk`delete`,, `search``get`, dan `index` untuk peran tersebut.

1. Setelah menambahkan izin yang diperlukan, Anda harus memasukkan ARN peran layanan basis Pengetahuan Anda untuk OpenSearch peran back-end. Melakukan langkah ini akan menyelesaikan pemetaan antara peran Layanan Basis Pengetahuan Anda dan OpenSearch peran, yang kemudian memberikan izin Pangkalan Pengetahuan Batuan Dasar Amazon untuk mengakses indeks vektor di OpenSearch domain dan melakukan operasi yang diperlukan.

**Topics**
+ [Pertimbangan utama](#kb-osm-permissions-prereq-considerations)
+ [Ikhtisar konfigurasi izin](#kb-osm-permissions-prereq-overview)
+ [Mengonfigurasi kebijakan IAM](#kb-osm-permissions-iam)
+ [(Opsional) Kontrol akses berbutir halus](#kb-osm-permissions-console-fgap)
+ [Mengonfigurasi kebijakan berbasis sumber daya untuk kluster Terkelola OpenSearch](kb-osm-permissions-slr-rbp.md)
+ [Mengkonfigurasi OpenSearch izin dengan kontrol akses berbutir halus](kb-osm-permissions-console-fgap.md)

# Mengonfigurasi kebijakan berbasis sumber daya untuk kluster Terkelola OpenSearch
<a name="kb-osm-permissions-slr-rbp"></a>

Saat membuat basis pengetahuan, Anda dapat membuat peran kustom Anda sendiri atau membiarkan Amazon Bedrock membuatnya untuk Anda. Cara Anda mengonfigurasi izin bergantung pada apakah Anda membuat peran baru atau menggunakan peran yang sudah ada. Jika Anda sudah memiliki peran IAM yang sudah ada, Anda harus memastikan bahwa kebijakan akses domain Anda tidak mencegah peran di akun Anda melakukan tindakan OpenSearch API yang diperlukan.

Jika Anda memilih untuk mengizinkan Pangkalan Pengetahuan Amazon Bedrock membuat peran IAM untuk Anda, Anda harus memastikan bahwa kebijakan akses domain Anda memberikan izin untuk melakukan tindakan OpenSearch API yang diperlukan oleh peran di akun Anda. Jika domain Anda memiliki kebijakan akses terbatas, domain dapat mencegah peran Anda melakukan tindakan ini. Berikut ini menunjukkan contoh kebijakan berbasis sumber daya yang membatasi.

Dalam hal ini, Anda dapat:
+ Buat basis pengetahuan Anda menggunakan peran IAM yang ada sehingga OpenSearch domain Anda dapat memberikan akses ke peran ini untuk melakukan operasi yang diperlukan.
+ Atau, Anda dapat membiarkan Amazon Bedrock membuat peran baru untuk Anda. Dalam hal ini, Anda harus memastikan bahwa kebijakan akses domain harus memberikan izin untuk melakukan tindakan OpenSearch API yang diperlukan oleh peran di akun Anda.

Bagian berikut menunjukkan contoh kebijakan IAM yang memberikan izin yang diperlukan dan bagaimana Anda dapat memperbarui kebijakan akses domain sehingga memberikan izin untuk melakukan operasi API yang diperlukan. OpenSearch 

**Topics**
+ [Contoh kebijakan berbasis identitas dan sumber daya IAM](#kb-osm-permissions-iam)
+ [Membuat peran layanan Amazon Bedrock Knowledge Bases](#kb-osm-permissions-slr)
+ [Memperbarui kebijakan berbasis sumber daya](#kb-osm-permissions-console-rbp)

## Contoh kebijakan berbasis identitas dan sumber daya IAM
<a name="kb-osm-permissions-iam"></a>

Bagian ini menyediakan contoh kebijakan identitas dan kebijakan berbasis sumber daya yang dapat Anda konfigurasikan untuk OpenSearch domain Anda saat mengintegrasikan dengan Pangkalan Pengetahuan Amazon Bedrock. Anda harus memberikan izin Amazon Bedrock untuk melakukan tindakan ini pada indeks yang Anda berikan Basis Pengetahuan Anda.


****  

| Tindakan | Sumber daya | Deskripsi | 
| --- | --- | --- | 
| es:ESHttpPost | arn:<partition>:es:<region>:<accountId>:domain/<domainName>/<indexName> | Untuk memasukkan informasi ke indeks | 
| es:ESHttpGet |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/kb-osm-permissions-slr-rbp.html)  | Untuk mencari informasi dari indeks. Tindakan ini dikonfigurasi baik di domain/index level maupun domain/index/\$1 level. Pada domain/index level tersebut, bisa mendapatkan detail tingkat tinggi tentang indeks, seperti jenis mesin. Untuk mengambil detail yang disimpan dalam indeks, izin diperlukan di tingkat tersebut. domain/index/\$1 | 
| es:ESHttpHead |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/kb-osm-permissions-slr-rbp.html)  | Untuk mendapatkan informasi dari indeks. Tindakan ini dikonfigurasi baik di domain/index level maupun domain/index/\$1 level, jika informasi perlu diperoleh pada tingkat yang lebih tinggi, seperti apakah indeks tertentu ada. | 
| es:ESHttpDelete | arn:<partition>:es:<region>:<accountId>:domain/<domainName>/<indexName> | Untuk menghapus informasi ke indeks | 
| es:DescribeDomain | arn:<partition>:es:<region>:<accountId>:domain/<domainName> | Untuk melakukan validasi pada domain, seperti versi mesin yang digunakan. | 

### Contoh kebijakan berbasis identitas
<a name="kb-osm-permissions-idpolicy"></a>

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "OpenSearchIndexAccess",
            "Effect": "Allow",
            "Action": [
                "es:ESHttpGet",
                "es:ESHttpPost",
                "es:ESHttpPut",
                "es:ESHttpDelete"
            ],
            "Resource": [
                "arn:aws:es:us-east-1:123456789012:domain/domainName/indexName/*"
            ]
        },
        {
            "Sid": "OpenSearchIndexGetAccess",
            "Effect": "Allow",
            "Action": [
                "es:ESHttpGet",
                "es:ESHttpHead"
            ],
            "Resource": [
            "arn:aws:es:us-east-1:123456789012:domain/domainName/indexName"
            ]
        },
        {
            "Sid": "OpenSearchDomainValidation",
            "Effect": "Allow",
            "Action": [
                "es:DescribeDomain"
            ],
            "Resource": [
            "arn:aws:es:us-east-1:123456789012:domain/domainName"
            ]
        }
    ]
}
```

------

### Contoh kebijakan berbasis sumber daya
<a name="kb-osm-permissions-rbp"></a>

**catatan**  
Pastikan bahwa peran layanan telah dibuat agar dapat digunakan dalam kebijakan berbasis sumber daya.

## Membuat peran layanan Amazon Bedrock Knowledge Bases
<a name="kb-osm-permissions-slr"></a>

Saat Anda membuat basis pengetahuan, Anda dapat memilih opsi untuk membuat dan menggunakan peran layanan baru. Bagian ini memandu Anda melalui pembuatan peran layanan Amazon Bedrock Knowledge Bases. Dengan memetakan kebijakan berbasis sumber daya dan kebijakan akses berbutir halus ke peran ini, Amazon Bedrock akan memberikan izin kepada Amazon Bedrock untuk membuat permintaan ke domain. OpenSearch 

**Untuk menentukan peran layanan Amazon Bedrock Knowledge Bases:**

1. Di konsol Amazon Bedrock, buka [Pangkalan Pengetahuan](https://console.aws.amazon.com/bedrock/home#/knowledge-bases).

1. Pilih **Buat** dan kemudian pilih **Basis pengetahuan dengan penyimpanan vektor**.

1. Pilih **Buat dan gunakan peran layanan baru**. Anda dapat menggunakan default, atau memberikan nama peran khusus, dan Amazon Bedrock akan secara otomatis membuat peran layanan Basis Pengetahuan untuk Anda.

1. Lanjutkan melalui konsol untuk mengonfigurasi sumber data Anda dan strategi parsing dan chunking.

1. Pilih model Embeddings dan kemudian, di bawah **Pilih penyimpanan vektor yang ada, pilih** **Amazon OpenSearch** Managed Cluster.

**penting**  
Sebelum Anda melanjutkan untuk membuat basis pengetahuan, selesaikan langkah-langkah berikut untuk mengonfigurasi kebijakan berbasis sumber daya dan kebijakan akses berbutir halus. Untuk langkah-langkah rinci tentang membuat basis pengetahuan, lihat[Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md).

## Memperbarui kebijakan berbasis sumber daya
<a name="kb-osm-permissions-console-rbp"></a>

Jika OpenSearch domain Anda memiliki kebijakan akses terbatas, Anda dapat mengikuti petunjuk di halaman ini untuk memperbarui kebijakan berbasis sumber daya. Izin ini memungkinkan Basis Pengetahuan untuk menggunakan indeks yang Anda berikan, dan untuk mengambil definisi OpenSearch domain untuk melakukan validasi yang diperlukan pada domain.

**Untuk mengonfigurasi kebijakan berbasis sumber daya dari Konsol Manajemen AWS**

1. Buka [konsol OpenSearch Layanan Amazon](https://console.aws.amazon.com/aos/home?region=us-east-1#opensearch/dashboard).

1. Buka domain yang telah Anda buat, lalu buka **Konfigurasi Keamanan** tempat kebijakan berbasis sumber daya dikonfigurasi.

1. Edit kebijakan di tab **JSON**, lalu perbarui kebijakan yang serupa dengan. [Contoh kebijakan berbasis sumber daya](#kb-osm-permissions-rbp)

1. Sekarang Anda dapat kembali ke konsol Amazon Bedrock dan memberikan detail untuk OpenSearch domain dan indeks Anda seperti yang dijelaskan dalam [Pengaturan dasar Pengetahuan untuk Kluster Terkelola](knowledge-base-setup.md#knowledge-base-setup-osm).

# Mengkonfigurasi OpenSearch izin dengan kontrol akses berbutir halus
<a name="kb-osm-permissions-console-fgap"></a>

Meskipun opsional, kami sangat menyarankan Anda mengaktifkan kontrol akses berbutir halus untuk domain Anda. OpenSearch Dengan menggunakan kontrol akses berbutir halus, Anda dapat menggunakan kontrol akses berbasis peran, yang memungkinkan Anda membuat peran dengan izin tertentu dan memetakannya ke OpenSearch peran layanan Basis Pengetahuan. Pemetaan memberikan basis pengetahuan Anda izin minimum yang diperlukan yang memungkinkannya mengakses dan melakukan operasi pada OpenSearch domain dan indeks.

Untuk mengkonfigurasi dan menggunakan kontrol akses halus:

1. Pastikan OpenSearch domain yang Anda gunakan memiliki kontrol akses berbutir halus yang diaktifkan.

1. Untuk domain Anda yang menggunakan kontrol akses berbutir halus, konfigurasikan izin dengan kebijakan cakupan bawah dalam bentuk peran. OpenSearch

1. Untuk domain tempat Anda membuat peran, tambahkan pemetaan peran ke peran Layanan Basis Pengetahuan.

Langkah-langkah berikut menunjukkan cara mengonfigurasi OpenSearch peran Anda dan memastikan pemetaan yang benar antara OpenSearch peran dan peran layanan Basis Pengetahuan.

**Untuk membuat OpenSearch peran dan mengonfigurasi izin**  
Setelah mengaktifkan kontrol akses berbutir halus dan mengonfigurasi Amazon Bedrock untuk terhubung ke OpenSearch Layanan, Anda dapat mengonfigurasi izin menggunakan tautan OpenSearch Dasbor untuk setiap domain. OpenSearch 

**Untuk mengonfigurasi izin domain agar memungkinkan akses ke Amazon Bedrock:**

1. Buka OpenSearch Dasbor untuk OpenSearch domain yang ingin Anda gunakan. Untuk menemukan tautan ke Dasbor, buka domain yang Anda buat di konsol OpenSearch Layanan. Untuk domain yang berjalan OpenSearch, URL adalah format,`domain-endpoint/_dashboards/`. Untuk informasi selengkapnya, lihat [Dasbor](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/dashboards.html) di *panduan pengembang OpenSearch Layanan Amazon*.

1. Di OpenSearch Dasbor, pilih **Keamanan** dan kemudian pilih **Peran**.

1. Pilih **Buat peran**.

1. Berikan nama apa pun untuk peran tersebut, misalnya, **kb\$1opensearch\$1role**.

1. Di bawah **izin Cluster**, tambahkan izin berikut.
   + `indices:data/read/msearch`
   + `indices:data/write/bulk*`
   + `indices:data/read/mget*`

1. Di bawah **Izin indeks**, berikan nama untuk indeks vektor. Pilih **Buat grup izin baru**, lalu pilih **Buat grup tindakan baru**. Tambahkan izin berikut ke grup tindakan, seperti`KnowledgeBasesActionGroup`. Tambahkan izin berikut ke grup tindakan.
   + `indices:admin/get`
   + `indices:data/read/msearch`
   + `indices:data/read/search`
   + `indices:data/write/index`
   + `indices:data/write/update`
   + `indices:data/write/delete`
   + `indices:data/write/delete/byquery`
   + `indices:data/write/bulk*`
   + `indices:admin/mapping/put`
   + `indices:data/read/mget*`  
![\[Grup tindakan yang akan dibuat di OpenSearch Dasbor untuk menambahkan izin cluster dan indeks.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/kb-test-os-action-groups.png)

1. Pilih **Buat** untuk membuat OpenSearch peran.

Berikut ini menunjukkan OpenSearch peran sampel dengan izin yang ditambahkan.

![\[Contoh OpenSearch peran di OpenSearch Dasbor dengan izin ditambahkan.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/kb-test-os-dashboards-permissions.png)


**Untuk membuat pemetaan peran ke peran layanan Basis Pengetahuan Anda**

1. Identifikasi peran IAM yang perlu dipetakan.
   + Jika Anda membuat peran IAM kustom Anda sendiri, Anda dapat menyalin peran ARN untuk peran ini dari konsol IAM.
   + Jika Anda mengizinkan Basis Pengetahuan untuk membuat peran untuk Anda, Anda dapat mencatat peran ARN saat membuat basis pengetahuan Anda, dan kemudian menyalin peran ini ARN.

1. Buka OpenSearch Dasbor untuk OpenSearch domain yang ingin Anda gunakan. URL adalah format`domain-endpoint/_dashboards/`.

1. Pilih **Keamanan** dari panel navigasi.

1. Cari peran yang baru saja Anda buat dari daftar, misalnya, **kb\$1opensearch\$1role**, dan buka.

1. Pada tab **Pengguna yang Dipetakan**, pilih **Kelola** pemetaan

1. Di bagian **peran Backend**, masukkan ARN dari peran IAM AWS terkelola untuk Basis Pengetahuan. Bergantung pada apakah Anda membuat peran kustom sendiri atau membiarkan Pangkalan Pengetahuan membuat peran untuk Anda, salin informasi ARN peran dari konsol IAM atau konsol Amazon Bedrock, lalu masukkan informasi tersebut untuk peran **Backend** di konsol. OpenSearch Berikut adalah contohnya.

   ```
   arn:aws:iam::<accountId>:role/service-role/<knowledge-base-service-role>
   ```

1. Pilih **Peta**.

   Peran Knowledge Base Service sekarang dapat terhubung ke OpenSearch peran dan melakukan operasi yang diperlukan pada domain dan indeks.

# Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases
<a name="knowledge-base-create"></a>

Saat Anda membuat basis pengetahuan dengan menghubungkan ke sumber data, Anda mengatur atau menentukan yang berikut ini:
+ Informasi umum yang mendefinisikan dan mengidentifikasi basis pengetahuan
+ Peran layanan dengan izin ke basis pengetahuan.
+ Konfigurasi untuk basis pengetahuan, termasuk model embeddings yang akan digunakan saat mengonversi data dari sumber data, konfigurasi penyimpanan untuk layanan tempat menyimpan embeddings, dan, secara opsional, lokasi S3 untuk menyimpan data multimodal.

**catatan**  
Anda tidak dapat membuat basis pengetahuan dengan pengguna root. Masuk dengan pengguna IAM sebelum memulai langkah-langkah ini.

Perluas bagian yang sesuai dengan kasus penggunaan Anda:

## Gunakan konsol
<a name="knowledge-base-create-console"></a>

**Untuk mendirikan basis pengetahuan**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, pilih tombol buat dan pilih untuk membuat basis pengetahuan dengan penyimpanan vektor.

1. (Opsional) Ubah nama default dan berikan deskripsi untuk basis pengetahuan Anda.

1. Pilih peran AWS Identity and Access Management (IAM) yang memberikan izin Amazon Bedrock untuk mengakses layanan lain yang diperlukanAWS. Anda dapat mengizinkan Amazon Bedrock membuat peran layanan atau memilih untuk menggunakan [peran kustom Anda sendiri yang Anda buat untuk Neptune](kb-permissions.md#kb-permissions-neptune) Analytics.

1. Pilih sumber data untuk menghubungkan basis pengetahuan Anda.

1. (Opsional) Tambahkan tag ke basis pengetahuan Anda. Untuk informasi selengkapnya, lihat [Menandai sumber daya Amazon Bedrock](tagging.md).

1. (Opsional) Konfigurasikan layanan untuk mengirimkan log aktivitas untuk basis pengetahuan Anda.

1. Pergi ke bagian berikutnya dan ikuti langkah-langkah di [Connect sumber data ke basis pengetahuan Anda](data-source-connectors.md) untuk mengkonfigurasi sumber data.

1. Di bagian **model Embeddings**, lakukan hal berikut:

   1. Pilih model embeddings untuk mengubah data Anda menjadi embeddings vektor. Untuk data multimodal (gambar, audio, dan video), pilih model penyematan multimodal seperti Amazon Titan Multimodal Embeddings G1 atau Cohere Embed v3.
**catatan**  
Saat menggunakan Amazon Titan Multimodal Embeddings G1, Anda harus menyediakan bucket konten S3 dan hanya dapat menggunakan parser default. Model ini dioptimalkan untuk kasus penggunaan pencarian gambar. Untuk panduan komprehensif tentang memilih antara pendekatan multimodal, lihat[Membangun basis pengetahuan untuk konten multimodal](kb-multimodal.md).

   1. (Opsional) Perluas bagian **Konfigurasi tambahan** untuk melihat opsi konfigurasi berikut (tidak semua model mendukung semua konfigurasi):
      + **Jenis penyematan —** Apakah akan mengonversi data menjadi penyematan vektor floating-point (float32) (lebih tepat, tetapi lebih mahal) atau penyematan vektor biner (kurang tepat, tetapi lebih murah). [Untuk mempelajari tentang model embeddings mana yang mendukung vektor biner, lihat model embeddings yang didukung.](knowledge-base-supported.md)
      + **Dimensi vektor** — Nilai yang lebih tinggi meningkatkan akurasi tetapi meningkatkan biaya dan latensi.

1. Di bagian **database Vector**, lakukan hal berikut:

   1. Pilih toko vektor untuk menyimpan embeddings vektor yang akan digunakan untuk kueri. Anda memiliki opsi berikut:
      + **Cepat buat toko vektor baru** - pilih salah satu toko vektor yang tersedia untuk Amazon Bedrock untuk dibuat. Anda juga dapat secara opsional mengonfigurasi enkripsi AWS KMS kunci untuk penyimpanan vektor Anda.
**catatan**  
Saat menggunakan opsi ini, Amazon Bedrock secara otomatis menangani penempatan metadata untuk setiap penyimpanan vektor.
        + **Amazon OpenSearch Tanpa Server** - Pangkalan Pengetahuan Amazon Bedrock membuat koleksi dan indeks pencarian vektor Amazon OpenSearch Tanpa Server dan mengonfigurasinya dengan bidang yang diperlukan untuk Anda.
        + **Amazon Aurora PostgreSQL Tanpa Server — Amazon Bedrock menyiapkan toko vektor Amazon Aurora PostgreSQL** Tanpa Server. Proses ini mengambil data teks tidak terstruktur dari bucket Amazon S3, mengubahnya menjadi potongan teks dan vektor, lalu menyimpannya dalam database PostgreSQL. Untuk informasi selengkapnya, lihat [Cepat membuat Pangkalan Pengetahuan PostgreSQL Aurora untuk Amazon Bedrock](https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/AuroraPostgreSQL.quickcreatekb.html).
        + **Amazon Neptune Analytics** — Amazon Bedrock menggunakan teknik Retrieval Augmented Generation (RAG) yang dikombinasikan dengan grafik untuk meningkatkan aplikasi AI generatif sehingga pengguna akhir bisa mendapatkan respons yang lebih akurat dan komprehensif.
        + **Vektor Amazon S3 —** Amazon Bedrock Knowledge Bases membuat bucket vektor S3 dan indeks vektor yang akan menyimpan embeddings yang dihasilkan dari sumber data Anda.

          Anda dapat membuat basis pengetahuan untuk Vektor Amazon S3 di semua Wilayah AWS tempat Amazon Bedrock dan Amazon S3 Vektor tersedia. Untuk informasi ketersediaan wilayah, lihat [Vektor Amazon S3 di Panduan Pengguna](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors.html) *Amazon* S3.
**catatan**  
Saat menggunakan Vektor Amazon S3 dengan Pangkalan Pengetahuan Amazon Bedrock, Anda dapat melampirkan metadata kustom hingga 1 KB (termasuk metadata yang dapat difilter dan tidak dapat difilter) dan 35 kunci metadata per vektor. Untuk informasi rinci tentang batasan metadata, lihat [Dukungan metadata](knowledge-base-setup.md#metadata-support) di. [Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan](knowledge-base-setup.md)
      + **Pilih penyimpanan vektor yang telah Anda buat** — Pilih penyimpanan vektor yang didukung dan identifikasi nama bidang vektor dan nama bidang metadata dalam indeks vektor. Untuk informasi selengkapnya, lihat [Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan](knowledge-base-setup.md).
**catatan**  
Jika sumber data Anda adalah instans Confluence SharePoint, Microsoft, atau Salesforce, satu-satunya layanan penyimpanan vektor yang didukung adalah Amazon Tanpa Server. OpenSearch 

   1. (Opsional) Perluas bagian **Konfigurasi tambahan** dan ubah konfigurasi yang relevan.

1. Jika sumber data Anda berisi gambar, tentukan URI Amazon S3 untuk menyimpan gambar yang akan diekstrak parser dari data di tujuan penyimpanan **Multimodal**. Gambar dapat dikembalikan selama kueri. Anda juga dapat secara opsional memilih kunci yang dikelola pelanggan alih-alih default Kunci yang dikelola AWS untuk mengenkripsi data Anda.
**catatan**  
Data multimodal hanya didukung dengan Amazon S3 dan sumber data khusus.
**catatan**  
Saat menggunakan model penyematan multimodal:  
Amazon Titan Multimodal Embeddings G1 memerlukan bucket konten S3 dan bekerja paling baik dengan kumpulan data khusus gambar menggunakan parser default
Cohere Embed v3 mendukung kumpulan data teks dan gambar campuran dan dapat digunakan dengan konfigurasi parser apa pun
Untuk kasus penggunaan pencarian gambar, hindari penggunaan Bedrock Data Automation (BDA) atau parser model foundation dengan Titan G1 karena keterbatasan token
Tujuan penyimpanan multimodal membuat salinan file untuk tujuan pengambilan, yang dapat dikenakan biaya penyimpanan tambahan

1. Pilih **Berikutnya** dan tinjau detail basis pengetahuan Anda. Anda dapat mengedit bagian apa pun sebelum melanjutkan dan membuat basis pengetahuan Anda.
**catatan**  
Waktu yang dibutuhkan untuk membuat basis pengetahuan tergantung pada konfigurasi spesifik Anda. Ketika pembuatan basis pengetahuan telah selesai, status basis pengetahuan berubah menjadi keadaan siap atau tersedia.  
Setelah basis pengetahuan Anda siap dan tersedia, sinkronkan sumber data Anda untuk pertama kalinya dan kapan pun Anda ingin memperbarui konten Anda. Pilih basis pengetahuan Anda di konsol dan pilih **Sinkronkan** dalam bagian ikhtisar sumber data.

## Gunakan API
<a name="knowledge-base-create-api"></a>

Untuk membuat basis pengetahuan, kirim [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt).

**catatan**  
Jika Anda lebih suka membiarkan Amazon Bedrock membuat dan mengelola penyimpanan vektor untuk Anda, gunakan konsol. Untuk informasi selengkapnya, perluas **bagian Gunakan konsol** dalam topik ini.

Bidang berikut diperlukan:


****  

| Bidang | Deskripsi dasar | 
| --- | --- | 
| name | Nama untuk basis pengetahuan | 
| roleArn | ARN dari peran layanan [Pangkalan Pengetahuan Batuan Dasar Amazon](kb-permissions.md). | 
| knowledgeBaseConfiguration | Berisi konfigurasi untuk basis pengetahuan. Lihat detail di bawah ini. | 
| StorageConfiguration | (Hanya diperlukan jika Anda terhubung ke sumber data yang tidak terstruktur).Berisi konfigurasi untuk layanan sumber data yang Anda pilih. | 

Bidang berikut adalah opsional:


****  

| Bidang | Kasus penggunaan | 
| --- | --- | 
| deskripsi | Deskripsi untuk basis pengetahuan. | 
| clientToken | Untuk memastikan permintaan API selesai hanya sekali. Untuk informasi selengkapnya, lihat [Memastikan idempotensi](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html). | 
| tag | Untuk mengaitkan tag dengan aliran. Untuk informasi selengkapnya, lihat [Menandai sumber daya Amazon Bedrock](tagging.md). | 

Di `knowledgeBaseConfiguration` lapangan, yang memetakan ke [KnowledgeBaseConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_KnowledgeBaseConfiguration.html)objek, tentukan `VECTOR` di `type` lapangan dan sertakan [VectorKnowledgeBaseConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorKnowledgeBaseConfiguration.html)objek. Dalam objek, sertakan bidang-bidang berikut:
+ `embeddingModelArn`— ARN dari model embedding yang akan digunakan.
+ `embeddingModelConfiguration`— Konfigurasi untuk model embedding. Untuk melihat kemungkinan nilai yang dapat Anda tentukan untuk setiap model yang didukung, lihat[Model dan Wilayah yang didukung untuk basis pengetahuan Amazon Bedrock](knowledge-base-supported.md).
+ (Jika Anda berencana untuk memasukkan data multimodal, yang mencakup gambar, gambar, bagan, atau tabel, dalam basis pengetahuan Anda) `supplementalDataStorageConfiguration` — Peta ke [SupplementalDataStorageLocation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_SupplementalDataStorageLocation.html)objek, di mana Anda menentukan lokasi S3 untuk menyimpan data yang diekstraksi. Untuk informasi selengkapnya, lihat [Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).

Di `storageConfiguration` bidang, yang memetakan ke [StorageConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StorageConfiguration.html)objek, tentukan penyimpanan vektor yang Anda rencanakan untuk terhubung di `type` lapangan dan sertakan bidang yang sesuai dengan penyimpanan vektor itu. Lihat setiap jenis konfigurasi penyimpanan vektor di [StorageConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StorageConfiguration.html)untuk detail tentang informasi yang perlu Anda berikan.

Berikut ini menunjukkan contoh permintaan untuk membuat basis pengetahuan yang terhubung ke koleksi Amazon OpenSearch Tanpa Server. Data dari sumber data yang terhubung akan diubah menjadi embeddings vektor biner dengan Amazon Titan Text Embeddings V2 dan data multimodal yang diekstraksi oleh parser diatur untuk disimpan dalam ember yang disebut. *MyBucket*

```
PUT /knowledgebases/ HTTP/1.1
Content-type: application/json

{
   "name": "MyKB",
   "description": "My knowledge base",
   "roleArn": "arn:aws:iam::111122223333:role/service-role/AmazonBedrockExecutionRoleForKnowledgeBase_123",
   "knowledgeBaseConfiguration": {
      "type": "VECTOR",
      "vectorKnowledgeBaseConfiguration": { 
         "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.titan-embed-text-v2:0",
         "embeddingModelConfiguration": { 
            "bedrockEmbeddingModelConfiguration": { 
               "dimensions": 1024,
               "embeddingDataType": "BINARY"
            }
         },
         "supplementalDataStorageConfiguration": { 
            "storageLocations": [ 
               { 
                  "s3Location": { 
                     "uri": "arn:aws:s3:::MyBucket"
                  },
                  "type": "S3"
               }
            ]
         }
      }
   },
   "storageConfiguration": { 
      "opensearchServerlessConfiguration": { 
         "collectionArn": "arn:aws:aoss:us-east-1:111122223333:collection/abcdefghij1234567890",
         "fieldMapping": { 
            "metadataField": "metadata",
            "textField": "text",
            "vectorField": "vector"
         },
         "vectorIndexName": "MyVectorIndex"
      }
   }
}
```

**Topics**
+ [Connect sumber data ke basis pengetahuan Anda](data-source-connectors.md)
+ [Sesuaikan konsumsi untuk sumber data](kb-data-source-customize-ingestion.md)
+ [Siapkan konfigurasi keamanan untuk basis pengetahuan Anda](kb-create-security.md)

# Connect sumber data ke basis pengetahuan Anda
<a name="data-source-connectors"></a>

Setelah menyelesaikan konfigurasi untuk basis pengetahuan Anda, Anda menghubungkan sumber data yang didukung ke basis pengetahuan.

Amazon Bedrock Knowledge Bases mendukung koneksi ke sumber data yang tidak terstruktur atau ke penyimpanan data terstruktur melalui mesin kueri. Pilih topik untuk mempelajari cara menyambung ke jenis sumber data tersebut:

**Dukungan konten multimodal**  
Konten multimodal (file gambar, audio, dan video) hanya didukung dengan Amazon S3 dan sumber data khusus. Jenis sumber data lainnya akan melewati file multimodal selama konsumsi. Untuk panduan komprehensif tentang bekerja dengan konten multimodal, lihat[Membangun basis pengetahuan untuk konten multimodal](kb-multimodal.md).

Untuk mempelajari cara menyambung ke sumber data menggunakan konsol Amazon Bedrock, pilih topik yang sesuai dengan tipe sumber data Anda di bagian bawah halaman ini:

Untuk menyambung ke sumber data menggunakan Amazon Bedrock API, kirim [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)permintaan dengan titik akhir waktu proses [Agen untuk Amazon Bedrock.](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-rt)

Bidang berikut diperlukan:


****  

| Bidang | Deskripsi dasar | 
| --- | --- | 
| knowledgeBaseId | ID basis pengetahuan. | 
| name | Nama untuk basis pengetahuan. | 
| dataSourceConfiguration | Tentukan layanan sumber data atau ketik di type bidang dan sertakan bidang yang sesuai. Untuk detail selengkapnya tentang konfigurasi khusus layanan, pilih topik untuk layanan dari topik di bagian bawah halaman ini. | 

Bidang berikut adalah opsional:


****  

| Bidang | Kasus penggunaan | 
| --- | --- | 
| deskripsi | Untuk memberikan deskripsi untuk sumber data. | 
| vectorIngestionConfiguration | Berisi konfigurasi untuk menyesuaikan proses konsumsi. Untuk informasi selengkapnya, lihat [Sesuaikan konsumsi untuk sumber data](kb-data-source-customize-ingestion.md). | 
| dataDeletionPolicy | Untuk menentukan apakah ke RETAIN embeddings vektor di penyimpanan vektor atau ke mereka. DELETE | 
| serverSideEncryptionKonfigurasi | Untuk mengenkripsi data sementara selama sinkronisasi data dengan kunci yang dikelola pelanggan, tentukan ARN di lapangan. kmsKeyArn | 
| clientToken | Untuk memastikan permintaan API selesai hanya sekali. Untuk informasi selengkapnya, lihat [Memastikan idempotensi](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html). | 

Pilih topik untuk mempelajari lebih lanjut tentang layanan dan mengonfigurasinya.

**Topics**
+ [Connect ke Amazon S3 untuk basis pengetahuan Anda](s3-data-source-connector.md)
+ [Connect to Confluence untuk basis pengetahuan Anda](confluence-data-source-connector.md)
+ [Connect ke Microsoft SharePoint untuk basis pengetahuan Anda](sharepoint-data-source-connector.md)
+ [Connect to Salesforce untuk basis pengetahuan Anda](salesforce-data-source-connector.md)
+ [Merayapi halaman web untuk basis pengetahuan Anda](webcrawl-data-source-connector.md)
+ [Hubungkan basis pengetahuan Anda ke sumber data kustom](custom-data-source-connector.md)

# Connect ke Amazon S3 untuk basis pengetahuan Anda
<a name="s3-data-source-connector"></a>

Amazon S3 adalah layanan penyimpanan objek yang menyimpan data sebagai objek dalam bucket. [Anda dapat terhubung ke bucket Amazon S3 untuk basis pengetahuan Amazon Bedrock Anda dengan menggunakan [AWSManagement Console untuk Amazon Bedrock atau API [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)(lihat Amazon Bedrock](https://console.aws.amazon.com/bedrock/home) didukung dan). SDKs AWS CLI](https://docs.aws.amazon.com/bedrock/latest/APIReference/welcome.html)

**Dukungan konten multimodal**  
Sumber data Amazon S3 mendukung konten multimodal termasuk file gambar, audio, dan video. Untuk panduan komprehensif tentang bekerja dengan konten multimodal, lihat[Membangun basis pengetahuan untuk konten multimodal](kb-multimodal.md).

Anda dapat mengunggah sejumlah kecil file ke bucket Amazon S3 menggunakan konsol Amazon S3 atau API. Anda juga dapat menggunakan [AWS DataSync](https://docs.aws.amazon.com/datasync/latest/userguide/create-s3-location.html)untuk mengunggah beberapa file ke S3 secara terus menerus, dan mentransfer file sesuai jadwal dari lokal, edge, cloud lain, atau AWS penyimpanan.

Saat ini hanya bucket General Purpose S3 yang didukung.

Ada batasan berapa banyak file dan MB per file yang dapat dirayapi. Lihat [Kuota untuk basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html).

**Topics**
+ [Fitur yang didukung](#supported-features-s3-connector)
+ [Prasyarat](#prerequisites-s3-connector)
+ [Konfigurasi koneksi](#configuration-s3-connector)

## Fitur yang didukung
<a name="supported-features-s3-connector"></a>
+ Bidang metadata dokumen
+ Awalan inklusi
+ Konten tambahan disinkronkan untuk konten yang ditambahkan, diperbarui, dihapus

## Prasyarat
<a name="prerequisites-s3-connector"></a>

**Di Amazon S3, pastikan Anda**:
+ Perhatikan URI bucket Amazon S3, Nama Sumber Daya Amazon (ARN), dan ID AWS akun untuk pemilik bucket. Anda dapat menemukan URI dan ARN di bagian properti di konsol Amazon S3. Bucket Anda harus berada di Wilayah yang sama dengan basis pengetahuan Amazon Bedrock Anda. Anda harus memiliki izin untuk mengakses ember.

**Di AWS akun Anda, pastikan Anda**:
+ Sertakan izin yang diperlukan untuk terhubung ke sumber data Anda dalam role/permissions kebijakan AWS Identity and Access Management (IAM) untuk basis pengetahuan Anda. Untuk informasi tentang izin yang diperlukan untuk sumber data ini untuk ditambahkan ke IAM peran basis pengetahuan Anda, lihat [Izin untuk mengakses sumber data](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html#kb-permissions-access-ds).

**catatan**  
Jika Anda menggunakan konsol, IAM peran dengan semua izin yang diperlukan dapat dibuat untuk Anda sebagai bagian dari langkah-langkah untuk membuat basis pengetahuan. Setelah Anda mengonfigurasi sumber data dan konfigurasi lainnya, IAM peran dengan semua izin yang diperlukan diterapkan ke basis pengetahuan khusus Anda.

## Konfigurasi koneksi
<a name="configuration-s3-connector"></a>

Untuk terhubung ke bucket Amazon S3, Anda harus memberikan informasi konfigurasi yang diperlukan agar Amazon Bedrock dapat mengakses dan merayapi data Anda. Anda juga harus mengikuti[Prasyarat](#prerequisites-s3-connector).

Contoh konfigurasi untuk sumber data ini disertakan dalam bagian ini.

Untuk informasi selengkapnya tentang filter inklusi, kolom metadata dokumen, sinkronisasi inkremental, dan cara kerjanya, pilih yang berikut ini:

### Bidang metadata dokumen
<a name="ds-s3-metadata-fields"></a>

Anda dapat menyertakan file terpisah yang menentukan metadata dokumen fields/attributes untuk setiap file di sumber data Amazon S3 Anda dan apakah akan memasukkannya ke dalam embeddings saat mengindeks sumber data ke dalam penyimpanan vektor. Misalnya, Anda dapat membuat file dalam format berikut, beri nama, *fileName.extension.metadata.json* dan unggah ke bucket S3 Anda.

```
{
  "metadataAttributes": {
    "company": {
      "value": {
        "type": "STRING",
        "stringValue": "BioPharm Innovations"
      },
      "includeForEmbedding": true
    },
    "created_date": {
      "value": {
        "type": "NUMBER",
        "numberValue": 20221205
      },
      "includeForEmbedding": true
    },
    "author": {
      "value": {
        "type": "STRING",
        "stringValue": "Lisa Thompson"
      },
      "includeForEmbedding": true
    },
    "origin": {
      "value": {
        "type": "STRING",
        "stringValue": "Overview"
      },
      "includeForEmbedding": true
    }
  }
}
```

File metadata harus menggunakan nama yang sama dengan file dokumen sumber terkait, dengan `.metadata.json` ditambahkan ke akhir nama file. File metadata harus disimpan di folder atau lokasi yang sama dengan file sumber di bucket Amazon S3 Anda. File tidak boleh melebihi batas 10 KB. Untuk informasi tentang tipe attribute/field data yang didukung dan operator pemfilteran yang dapat Anda terapkan ke bidang metadata, lihat [Metadata](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-test-config.html) dan pemfilteran.

### Awalan inklusi
<a name="ds-s3-inclusion-exclusion"></a>

Anda dapat menentukan awalan inklusi, yang merupakan awalan jalur Amazon S3, tempat Anda dapat menggunakan file S3 atau folder alih-alih seluruh bucket untuk membuat konektor sumber data S3.

### Sinkronisasi inkremental
<a name="ds-s3-incremental-sync"></a>

Konektor sumber data merayapi konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan basis pengetahuan Anda. Amazon Bedrockdapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan merayapi konten yang berubah sejak sinkronisasi terakhir. Saat Anda menyinkronkan sumber data dengan basis pengetahuan untuk pertama kalinya, semua konten dirayapi secara default.

Untuk menyinkronkan sumber data Anda dengan basis pengetahuan Anda, gunakan [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)API atau pilih basis pengetahuan Anda di konsol dan pilih **Sinkronkan** dalam bagian ikhtisar sumber data.

**penting**  
Semua data yang Anda sinkronkan dari sumber data Anda akan tersedia bagi siapa saja yang memiliki `bedrock:Retrieve` izin untuk mengambil data. Ini juga dapat mencakup data apa pun dengan izin sumber data terkontrol. Untuk informasi selengkapnya, lihat [Izin basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html).

------
#### [ Console ]

**Untuk menghubungkan bucket Amazon S3 ke basis pengetahuan Anda**

1. Ikuti langkah-langkah di [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan pilih **Amazon S3** sebagai sumber data.

1. Berikan nama untuk sumber data.

1. Tentukan apakah bucket Amazon S3 ada di akun Anda saat ini atau AWS akun lainAWS. Ember Anda harus berada di Wilayah yang sama dengan basis pengetahuan.

1. (Opsional) Jika bucket Amazon S3 dienkripsi dengan kunci KMS, sertakan kuncinya. Untuk informasi selengkapnya, lihat [Izin untuk mendekripsi AWS KMS kunci Anda untuk sumber data Anda di Amazon S3](encryption-kb.md#encryption-kb-ds).

1. (Opsional) Di bagian **Parsing dan chunking konten**, Anda dapat menyesuaikan cara mengurai dan memotong data Anda. Lihat sumber daya berikut untuk mempelajari lebih lanjut tentang penyesuaian ini:
   + Untuk informasi selengkapnya tentang opsi penguraian, lihat[Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).
   + Untuk informasi lebih lanjut tentang strategi chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
**Awas**  
Anda tidak dapat mengubah strategi chunking setelah terhubung ke sumber data.
   + Untuk informasi selengkapnya tentang cara menyesuaikan potongan data dan pemrosesan metadata Anda dengan fungsi Lambda, lihat. [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md)

1. Di bagian **Pengaturan lanjutan**, Anda dapat secara opsional mengonfigurasi yang berikut:
   + **Kunci KMS untuk penyimpanan data sementara.** — Anda dapat mengenkripsi data sementara sambil mengubah data Anda menjadi embeddings dengan default atau kunci KMS Anda sendiri. Kunci yang dikelola AWS Untuk informasi selengkapnya, lihat [Enkripsi penyimpanan data sementara selama konsumsi data](encryption-kb.md#encryption-kb-ingestion).
   + **Kebijakan penghapusan data** — Anda dapat menghapus embeddings vektor untuk sumber data Anda yang disimpan di penyimpanan vektor secara default, atau memilih untuk menyimpan data penyimpanan vektor.

1. Lanjutkan untuk memilih model embeddings dan penyimpanan vektor. Untuk melihat langkah-langkah yang tersisa, kembali ke [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan lanjutkan dari langkah setelah menghubungkan sumber data Anda.

------
#### [ API ]

Berikut ini adalah contoh konfigurasi untuk menghubungkan ke Amazon S3 untuk basis pengetahuan Amazon Bedrock Anda. Anda mengonfigurasi sumber data menggunakan API dengan AWS CLI atau SDK yang didukung, seperti Python. Setelah menelepon [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html), Anda menelepon [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)untuk membuat sumber data dengan informasi koneksi Anda di`dataSourceConfiguration`.

Untuk mempelajari tentang penyesuaian yang dapat Anda terapkan pada konsumsi dengan menyertakan bidang opsional`vectorIngestionConfiguration`, lihat. [Sesuaikan konsumsi untuk sumber data](kb-data-source-customize-ingestion.md)

**AWS Command Line Interface**

```
aws bedrock-agent create-data-source \
 --name "S3-connector" \
 --description "S3 data source connector for Amazon Bedrock to use content in S3" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://s3-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"chunkingConfiguration":{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":{"maxTokens":100,"overlapPercentage":10}}}'
                    
s3-bedrock-connector-configuration.json
{
    "s3Configuration": {
	    "bucketArn": "arn:aws:s3:::bucket-name",
	    "bucketOwnerAccountId": "000000000000",
	    "inclusionPrefixes": [
	        "documents/"
	    ]
    },
    "type": "S3"	
}
```

------

# Connect to Confluence untuk basis pengetahuan Anda
<a name="confluence-data-source-connector"></a>

Atlassian Confluence adalah alat manajemen kerja kolaboratif yang dirancang untuk berbagi, menyimpan, dan mengerjakan perencanaan proyek, pengembangan perangkat lunak, dan manajemen produk. [Anda dapat terhubung ke instans Confluence untuk basis pengetahuan Amazon Bedrock Anda dengan menggunakan [AWS Management Console untuk Amazon Bedrock](https://console.aws.amazon.com/bedrock/home) atau API [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)(lihat Amazon Bedrock didukung dan). SDKs AWS CLI](https://docs.aws.amazon.com/bedrock/latest/APIReference/welcome.html)

**catatan**  
Konektor sumber data pertemuan dalam rilis pratinjau dan dapat berubah sewaktu-waktu.  
Sumber data pertemuan tidak mendukung data multimodal, seperti tabel, bagan, diagram, atau gambar lainnya.

Amazon Bedrock mendukung koneksi ke instans Confluence Cloud. Saat ini, hanya penyimpanan vektor Amazon OpenSearch Tanpa Server yang tersedia untuk digunakan dengan sumber data ini.

Ada batasan berapa banyak file dan MB per file yang dapat dirayapi. Lihat [Kuota untuk basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html).

**Topics**
+ [Fitur yang didukung](#supported-features-confluence-connector)
+ [Prasyarat](#prerequisites-confluence-connector)
+ [Konfigurasi koneksi](#configuration-confluence-connector)

## Fitur yang didukung
<a name="supported-features-confluence-connector"></a>
+ Deteksi otomatis bidang dokumen utama
+ Filter konten inklusi/pengecualian
+ Konten tambahan disinkronkan untuk konten yang ditambahkan, diperbarui, dihapus
+ OAuth 2.0 otentikasi, otentikasi dengan token Confluence API

## Prasyarat
<a name="prerequisites-confluence-connector"></a>

**Di Confluence, pastikan Anda**:
+ Catat URL instans Confluence Anda. Misalnya, untuk Confluence Cloud,. *https://example.atlassian.net* URL untuk Confluence Cloud harus berupa URL dasar, diakhiri dengan. *.atlassian.net*
+ Konfigurasikan kredenal otentikasi dasar yang berisi nama pengguna (email akun admin) dan kata sandi (token Confluence API) untuk memungkinkan Amazon Bedrock terhubung ke instans Confluence Cloud Anda. Untuk informasi tentang cara membuat token API Confluence, lihat [Mengelola token API untuk akun Atlassian Anda](https://support.atlassian.com/atlassian-account/docs/manage-api-tokens-for-your-atlassian-account/#Create-an-API-token) di situs web Atlassian.
+ (Opsional) Konfigurasikan aplikasi OAuth 2.0 dengan kredensyal kunci aplikasi, rahasia aplikasi, token akses, dan token penyegaran. Untuk informasi selengkapnya, lihat [OAuth 2.0 aplikasi](https://developer.atlassian.com/cloud/confluence/oauth-2-3lo-apps/) di situs web Atlassian.
+ Izin baca atau cakupan tertentu harus diaktifkan agar aplikasi OAuth 2.0 Anda dapat terhubung ke Confluence.

  API pertemuan:
  + offline\$1access
  + read:content:confluence — Lihat isi rinci 
  + baca:content-details:confluence - Lihat rincian konten 
  + baca:space-details:confluence — Lihat detail ruang
  + read:audit-log:confluence - Lihat catatan audit 
  + baca:page:confluence - Lihat halaman 
  + baca: lampiran: pertemuan - Lihat dan unduh lampiran konten 
  + baca:blogpost:confluence - Lihat blogposts 
  + baca: custom-content:confluence - Lihat konten kustom 
  + baca:comment:confluence — Lihat komentar 
  + baca:template:confluence - Lihat template konten 
  + read:label:confluence - Lihat label 
  + read:watcher:confluence - Lihat pengamat konten 
  + read:relation:confluence - Lihat hubungan entitas 
  + read:user:confluence — Lihat detail pengguna 
  + read:configuration:confluence - Lihat pengaturan Confluence 
  + read:space:confluence — Lihat detail ruang 
  + read:space.property:confluence - Lihat properti ruang 
  + read:user.property:confluence - Lihat properti pengguna 
  + read:space.setting:confluence - Lihat pengaturan ruang 
  + read:analytics.content:confluence - Lihat analitik untuk konten
  + read:content.property:confluence - Lihat properti konten
  + read:content.metadata:confluence — Lihat ringkasan konten 
  + read:inlinetask:confluence - Lihat tugas 
  + baca:task:confluence - Lihat tugas 
  + baca:whiteboard:confluence — Lihat papan tulis 
  + baca:app-data:confluence - Baca data aplikasi 
  + read:folder:confluence - Lihat folder
  + read:embed:confluence - Lihat data Smart Link

**Di AWS akun Anda, pastikan Anda**:
+ Simpan kredensyal otentikasi Anda secara [AWS Secrets Manager rahasia](https://docs.aws.amazon.com/secretsmanager/latest/userguide/create_secret.html) dan catat Amazon Resource Name (ARN) dari rahasianya. Ikuti petunjuk **konfigurasi Koneksi** di halaman ini untuk menyertakan pasangan nilai kunci yang harus disertakan dalam rahasia Anda.
+ Sertakan izin yang diperlukan untuk terhubung ke sumber data Anda dalam role/permissions kebijakan AWS Identity and Access Management (IAM) untuk basis pengetahuan Anda. Untuk informasi tentang izin yang diperlukan untuk sumber data ini untuk ditambahkan ke IAM peran basis pengetahuan Anda, lihat [Izin untuk mengakses sumber data](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html#kb-permissions-access-ds).

**catatan**  
Jika Anda menggunakan konsol, Anda dapat pergi ke AWS Secrets Manager untuk menambahkan rahasia Anda atau menggunakan rahasia yang ada sebagai bagian dari langkah konfigurasi sumber data. IAM Peran dengan semua izin yang diperlukan dapat dibuat untuk Anda sebagai bagian dari langkah konsol untuk membuat basis pengetahuan. Setelah Anda mengonfigurasi sumber data dan konfigurasi lainnya, IAM peran dengan semua izin yang diperlukan diterapkan ke basis pengetahuan khusus Anda.  
Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensyal dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensyal dan rahasia di seluruh sumber data.

## Konfigurasi koneksi
<a name="configuration-confluence-connector"></a>

Untuk menyambung ke instans Confluence, Anda harus memberikan informasi konfigurasi yang diperlukan agar Amazon Bedrock dapat mengakses dan meng-crawl data Anda. Anda juga harus mengikuti[Prasyarat](#prerequisites-confluence-connector).

Contoh konfigurasi untuk sumber data ini disertakan dalam bagian ini.

Untuk informasi selengkapnya tentang deteksi otomatis bidang dokumen, inclusion/exclusion filter, sinkronisasi inkremental, kredensyal otentikasi rahasia, dan cara kerjanya, pilih yang berikut ini:

### Deteksi otomatis bidang dokumen utama
<a name="ds-confluence-document-fields"></a>

Konektor sumber data secara otomatis mendeteksi dan merayapi semua bidang metadata utama dokumen atau konten Anda. Misalnya, konektor sumber data dapat merayapi badan dokumen yang setara dengan dokumen Anda, judul dokumen, tanggal pembuatan atau modifikasi dokumen, atau bidang inti lainnya yang mungkin berlaku untuk dokumen Anda.

**penting**  
Jika konten Anda menyertakan informasi sensitif, maka Amazon Bedrock dapat merespons menggunakan informasi sensitif.

Anda dapat menerapkan operator pemfilteran ke bidang metadata untuk membantu Anda lebih meningkatkan relevansi tanggapan. Misalnya, dokumentasikan “epoch\$1modification\$1time” atau jumlah detik yang berlalu 1 Januari 1970 untuk saat dokumen terakhir diperbarui. *Anda dapat memfilter data terbaru, di mana “epoch\$1modification\$1time” lebih besar dari angka tertentu.* Untuk informasi selengkapnya tentang operator pemfilteran yang dapat Anda terapkan ke bidang metadata, lihat [Metadata](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-test-config.html) dan pemfilteran.

### Filter inklusi/pengecualian
<a name="ds-confluence-inclusion-exclusion"></a>

Anda dapat menyertakan atau mengecualikan perayapan konten tertentu. Misalnya, Anda dapat menentukan pola prefix/regular ekspresi pengecualian untuk melewatkan perayapan file apa pun yang berisi “pribadi” dalam nama file. Anda juga dapat menentukan pola prefix/regular ekspresi inklusi untuk menyertakan entitas konten atau jenis konten tertentu. Jika Anda menentukan filter penyertaan dan pengecualian dan keduanya cocok dengan dokumen, filter pengecualian akan diutamakan dan dokumen tidak dirayapi.

Contoh pola ekspresi reguler untuk mengecualikan atau memfilter file PDF yang berisi “pribadi” dalam nama file:*”. \$1pribadi.\$1\$1\$1 .pdf*”

Anda dapat menerapkan inclusion/exclusion filter pada jenis konten berikut:
+ `Space`: Kunci spasi unik
+ `Page`: Judul halaman utama
+ `Blog`: Judul blog utama
+ `Comment`: Komentar yang termasuk dalam halaman atau blog tertentu. Tentukan *Re: Page/Blog Title*
+ `Attachment`: Nama file lampiran dengan ekstensinya

### Sinkronisasi inkremental
<a name="ds-confluence-incremental-sync"></a>

Konektor sumber data merayapi konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan basis pengetahuan Anda. Amazon Bedrock dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan merayapi konten yang berubah sejak sinkronisasi terakhir. Saat Anda menyinkronkan sumber data dengan basis pengetahuan untuk pertama kalinya, semua konten dirayapi secara default.

Untuk menyinkronkan sumber data Anda dengan basis pengetahuan Anda, gunakan [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)API atau pilih basis pengetahuan Anda di konsol dan pilih **Sinkronkan** dalam bagian ikhtisar sumber data.

**penting**  
Semua data yang Anda sinkronkan dari sumber data Anda akan tersedia bagi siapa saja yang memiliki `bedrock:Retrieve` izin untuk mengambil data. Ini juga dapat mencakup data apa pun dengan izin sumber data terkontrol. Untuk informasi selengkapnya, lihat [Izin basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html).

### Kredensi otentikasi rahasia
<a name="ds-confluence-secret-auth-credentials"></a>

(Jika menggunakan otentikasi dasar) Kredensyal otentikasi rahasia Anda AWS Secrets Manager harus menyertakan pasangan nilai kunci ini:
+ `username`: *admin user email address of Atlassian account*
+ `password`: *Confluence API token*

(Jika menggunakan otentikasi OAuth 2.0) Kredensyal otentikasi rahasia Anda AWS Secrets Manager harus menyertakan pasangan nilai kunci ini:
+ `confluenceAppKey`: *app key*
+ `confluenceAppSecret`: *app secret*
+ `confluenceAccessToken`: *app access token*
+ `confluenceRefreshToken`: *app refresh token*

**catatan**  
Token **akses** Confluence OAuth2 .0 memiliki waktu kedaluwarsa default 60 menit. Jika token ini kedaluwarsa saat sumber data Anda disinkronkan (pekerjaan sinkronisasi), Amazon Bedrock akan menggunakan token **penyegaran** yang disediakan untuk membuat ulang token ini. Regenerasi ini menyegarkan token akses dan penyegaran. Untuk menjaga token diperbarui dari pekerjaan sinkronisasi saat ini ke pekerjaan sinkronisasi berikutnya, Amazon Bedrock memerlukan write/put izin untuk kredensil rahasia Anda sebagai bagian dari peran IAM basis pengetahuan Anda.

**catatan**  
Rahasia Anda AWS Secrets Manager harus menggunakan Wilayah yang sama dari basis pengetahuan Anda.

------
#### [ Console ]

**Hubungkan instance Confluence ke basis pengetahuan Anda**

1. Ikuti langkah-langkah di [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan pilih **Confluence** sebagai sumber data.

1. Berikan nama dan deskripsi opsional untuk sumber data.

1. Berikan URL instans Confluence Anda. Misalnya, untuk Confluence Cloud,. *https://example.atlassian.net* URL untuk Confluence Cloud harus berupa URL dasar, diakhiri dengan. *.atlassian.net*

1. Di bagian **Pengaturan lanjutan**, Anda dapat secara opsional mengonfigurasi yang berikut:
   + **Kunci KMS untuk penyimpanan data sementara.** — Anda dapat mengenkripsi data sementara sambil mengubah data Anda menjadi embeddings dengan default atau kunci KMS Anda sendiri. Kunci yang dikelola AWS Untuk informasi selengkapnya, lihat [Enkripsi penyimpanan data sementara selama konsumsi data](encryption-kb.md#encryption-kb-ingestion).
   + **Kebijakan penghapusan data** — Anda dapat menghapus embeddings vektor untuk sumber data Anda yang disimpan di penyimpanan vektor secara default, atau memilih untuk menyimpan data penyimpanan vektor.

1. Berikan informasi autentikasi untuk terhubung ke instans Confluence Anda:
   + Untuk otentikasi dasar, buka AWS Secrets Manager untuk menambahkan kredensyal otentikasi rahasia Anda atau gunakan Amazon Resource Name (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi alamat *email *pengguna admin akun Atlassian sebagai nama pengguna dan token API Confluence sebagai pengganti kata sandi. Untuk informasi tentang cara membuat token API Confluence, lihat [Mengelola token API untuk akun Atlassian Anda](https://support.atlassian.com/atlassian-account/docs/manage-api-tokens-for-your-atlassian-account/#Create-an-API-token) di situs web Atlassian.
   + Untuk otentikasi OAuth 2.0, buka AWS Secrets Manager untuk menambahkan kredensyal otentikasi rahasia Anda atau gunakan Nama Sumber Daya Amazon (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi kunci aplikasi Confluence, rahasia aplikasi, token akses, dan token *refresh*. Untuk informasi selengkapnya, lihat [OAuth 2.0 aplikasi](https://developer.atlassian.com/cloud/confluence/oauth-2-3lo-apps/) di situs web Atlassian.

1. (Opsional) Di bagian **Parsing dan chunking konten**, Anda dapat menyesuaikan cara mengurai dan memotong data Anda. Lihat sumber daya berikut untuk mempelajari lebih lanjut tentang penyesuaian ini:
   + Untuk informasi selengkapnya tentang opsi penguraian, lihat[Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).
   + Untuk informasi lebih lanjut tentang strategi chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
**Awas**  
Anda tidak dapat mengubah strategi chunking setelah terhubung ke sumber data.
   + Untuk informasi selengkapnya tentang cara menyesuaikan potongan data dan pemrosesan metadata Anda dengan fungsi Lambda, lihat. [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md)

1. Pilih untuk menggunakan pola filters/regular ekspresi untuk menyertakan atau mengecualikan konten tertentu. Jika tidak, semua konten standar akan dirayapi.

1. Lanjutkan untuk memilih model embeddings dan penyimpanan vektor. Untuk melihat langkah-langkah yang tersisa, kembali ke [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan lanjutkan dari langkah setelah menghubungkan sumber data Anda.

------
#### [ API ]

Berikut ini adalah contoh konfigurasi untuk menghubungkan ke Confluence Cloud untuk basis pengetahuan Amazon Bedrock Anda. Anda mengonfigurasi sumber data menggunakan API dengan AWS CLI atau SDK yang didukung, seperti Python. Setelah menelepon [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html), Anda menelepon [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)untuk membuat sumber data dengan informasi koneksi Anda di`dataSourceConfiguration`.

Untuk mempelajari tentang penyesuaian yang dapat Anda terapkan pada konsumsi dengan menyertakan bidang opsional`vectorIngestionConfiguration`, lihat. [Sesuaikan konsumsi untuk sumber data](kb-data-source-customize-ingestion.md)

**AWS Command Line Interface**

```
aws bedrock create-data-source \
 --name "Confluence Cloud/SaaS connector" \
 --description "Confluence Cloud/SaaS data source connector for Amazon Bedrock to use content in Confluence" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://confluence-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}'

confluence-bedrock-connector-configuration.json
{
    "confluenceConfiguration": {
        "sourceConfiguration": {
            "hostUrl": "https://example.atlassian.net",
            "hostType": "SAAS",
            "authType": "OAUTH2_CLIENT_CREDENTIALS",
            "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Confluence"
        },
        "crawlerConfiguration": {
            "filterConfiguration": {
                "type": "PATTERN",
                "patternObjectFilter": {
                    "filters": [
                        {
                            "objectType": "Attachment",
                            "inclusionFilters": [
                                ".*\\.pdf"
                            ],
                            "exclusionFilters": [
                                ".*private.*\\.pdf"
                            ]
                        }
                    ]
                }
            }
        }
    },
    "type": "CONFLUENCE"
}
```

------

# Connect ke Microsoft SharePoint untuk basis pengetahuan Anda
<a name="sharepoint-data-source-connector"></a>

Microsoft SharePoint adalah layanan berbasis web kolaboratif untuk mengerjakan dokumen, halaman web, situs web, daftar, dan lainnya. Anda dapat menyambung ke SharePoint instans untuk basis pengetahuan Amazon Bedrock dengan menggunakan [AWS Management Console untuk Amazon Bedrock](https://console.aws.amazon.com/bedrock/home) atau [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)API (lihat Amazon Bedrock [didukung SDKs ](https://docs.aws.amazon.com/bedrock/latest/APIReference/welcome.html) dan). AWS CLI

**catatan**  
SharePoint konektor sumber data dalam rilis pratinjau dan dapat berubah.  
Sumber SharePoint data Microsoft tidak mendukung data multimodal, seperti tabel, bagan, diagram, atau gambar lainnya.

Amazon Bedrock mendukung koneksi ke instans SharePoint Online. Merayapi OneNote dokumen saat ini tidak didukung. Saat ini, hanya penyimpanan vektor Amazon OpenSearch Tanpa Server yang tersedia untuk digunakan dengan sumber data ini.

Ada batasan berapa banyak file dan MB per file yang dapat dirayapi. Lihat [Kuota untuk basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html).

**Topics**
+ [Fitur yang didukung](#supported-features-sharepoint-connector)
+ [Prasyarat](#prerequisites-sharepoint-connector)
+ [Konfigurasi koneksi](#configuration-sharepoint-connector)

## Fitur yang didukung
<a name="supported-features-sharepoint-connector"></a>
+ Deteksi otomatis bidang dokumen utama
+ Filter konten inklusi/pengecualian
+ Konten tambahan disinkronkan untuk konten yang ditambahkan, diperbarui, dihapus
+ SharePoint Autentikasi App-Only

## Prasyarat
<a name="prerequisites-sharepoint-connector"></a>

### SharePoint (Online)
<a name="prerequisites-sharepoint-connector-online"></a>

**Di SharePoint (Online) Anda, selesaikan langkah-langkah berikut untuk menggunakan otentikasi SharePoint App-Only:**
+ Catat URL situs SharePoint online Anda/URLs. Misalnya, *https://yourdomain.sharepoint.com/sites/mysite*. URL Anda harus dimulai dengan *https* dan berisi*sharepoint.com*. URL situs Anda harus SharePoint situs yang sebenarnya, bukan *sharepoint.com/* atau *sites/mysite/home.aspx*
+ Catat nama domain URL instans SharePoint Online Anda/URLs.
+ Salin ID penyewa Microsoft 365 Anda. Anda dapat menemukan ID penyewa Anda di Properti portal Microsoft Entra Anda. Untuk detailnya, lihat [Menemukan ID penyewa Microsoft 365 Anda](https://learn.microsoft.com/en-us/sharepoint/find-your-office-365-tenant-id).
**catatan**  
Untuk contoh aplikasi, lihat [Mendaftarkan aplikasi klien di Microsoft Entra ID](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) (sebelumnya dikenal sebagai Azure Active Directory) di situs web Microsoft Learn. 
+ Konfigurasikan SharePoint kredenal Khusus Aplikasi.
+ Salin ID klien dan nilai rahasia klien saat memberikan izin ke SharePoint App-Only. Untuk informasi selengkapnya, lihat [Memberikan akses menggunakan Hanya SharePoint Aplikasi](https://learn.microsoft.com/en-us/sharepoint/dev/solution-guidance/security-apponly-azureacs).
**catatan**  
Anda tidak perlu menyiapkan izin API apa pun untuk SharePoint App-Only. Namun, Anda harus mengonfigurasi izin APP di SharePoint samping. Untuk informasi selengkapnya tentang izin APP yang diperlukan, lihat dokumentasi Microsoft tentang [Pemberian akses menggunakan SharePoint ](https://learn.microsoft.com/en-us/sharepoint/dev/solution-guidance/security-apponly-azureacs) Hanya Aplikasi.

### Akun AWS
<a name="prerequisites-sharepoint-connector-account"></a>

**Di AWS akun Anda, pastikan Anda**:
+ Simpan kredensyal otentikasi Anda secara [AWS Secrets Manager rahasia dan catat](https://docs.aws.amazon.com/secretsmanager/latest/userguide/create_secret.html) Nama Sumber Daya Amazon (ARN) rahasianya. Ikuti petunjuk **konfigurasi Koneksi** di halaman ini untuk menyertakan pasangan nilai kunci yang harus disertakan dalam rahasia Anda.
+ Sertakan izin yang diperlukan untuk terhubung ke sumber data Anda dalam role/permissions kebijakan AWS Identity and Access Management (IAM) untuk basis pengetahuan Anda. Untuk informasi tentang izin yang diperlukan untuk sumber data ini untuk ditambahkan ke IAM peran basis pengetahuan Anda, lihat [Izin untuk mengakses sumber data](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html#kb-permissions-access-ds).

**catatan**  
Jika Anda menggunakan konsol, Anda dapat pergi ke AWS Secrets Manager untuk menambahkan rahasia Anda atau menggunakan rahasia yang ada sebagai bagian dari langkah konfigurasi sumber data. IAM Peran dengan semua izin yang diperlukan dapat dibuat untuk Anda sebagai bagian dari langkah konsol untuk membuat basis pengetahuan. Setelah Anda mengonfigurasi sumber data dan konfigurasi lainnya, IAM peran dengan semua izin yang diperlukan diterapkan ke basis pengetahuan khusus Anda.  
Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensyal dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensyal dan rahasia di seluruh sumber data.

## Konfigurasi koneksi
<a name="configuration-sharepoint-connector"></a>

Untuk menyambung ke SharePoint instans, Anda harus memberikan informasi konfigurasi yang diperlukan agar Amazon Bedrock dapat mengakses dan meng-crawl data Anda. Anda juga harus mengikuti[Prasyarat](#prerequisites-sharepoint-connector).

Contoh konfigurasi untuk sumber data ini disertakan dalam bagian ini.

Untuk informasi selengkapnya tentang deteksi otomatis bidang dokumen, filter inklusi/pengecualian, sinkronisasi inkremental, kredensi otentikasi rahasia, dan cara kerjanya, pilih yang berikut ini:

### Deteksi otomatis bidang dokumen utama
<a name="ds-sharepoint-document-fields"></a>

Konektor sumber data secara otomatis mendeteksi dan merayapi semua bidang metadata utama dokumen atau konten Anda. Misalnya, konektor sumber data dapat merayapi badan dokumen yang setara dengan dokumen Anda, judul dokumen, tanggal pembuatan atau modifikasi dokumen, atau bidang inti lainnya yang mungkin berlaku untuk dokumen Anda.

**penting**  
Jika konten Anda menyertakan informasi sensitif, maka Amazon Bedrock dapat merespons menggunakan informasi sensitif.

Anda dapat menerapkan operator pemfilteran ke bidang metadata untuk membantu Anda lebih meningkatkan relevansi tanggapan. Misalnya, dokumentasikan “epoch\$1modification\$1time” atau jumlah detik yang berlalu 1 Januari 1970 untuk saat dokumen terakhir diperbarui. *Anda dapat memfilter data terbaru, di mana “epoch\$1modification\$1time” lebih besar dari angka tertentu.* Untuk informasi selengkapnya tentang operator pemfilteran yang dapat Anda terapkan ke bidang metadata, lihat [Metadata](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-test-config.html) dan pemfilteran.

### Filter inklusi/pengecualian
<a name="ds-sharepoint-inclusion-exclusion"></a>

Anda dapat menyertakan atau mengecualikan perayapan konten tertentu. Misalnya, Anda dapat menentukan pola prefix/regular ekspresi pengecualian untuk melewatkan perayapan file apa pun yang berisi “pribadi” dalam nama file. Anda juga dapat menentukan pola prefix/regular ekspresi inklusi untuk menyertakan entitas konten atau jenis konten tertentu. Jika Anda menentukan filter penyertaan dan pengecualian dan keduanya cocok dengan dokumen, filter pengecualian akan diutamakan dan dokumen tidak dirayapi.

Contoh pola ekspresi reguler untuk mengecualikan atau memfilter file PDF yang berisi “pribadi” dalam nama file:*”. \$1pribadi.\$1\$1\$1 .pdf*”

Anda dapat menerapkan inclusion/exclusion filter pada jenis konten berikut:
+ `Page`: Judul halaman utama
+ `Event`: Nama acara
+ `File`: Nama file dengan ekstensi untuk lampiran dan semua file dokumen

Merayapi OneNote dokumen saat ini tidak didukung.

### Sinkronisasi inkremental
<a name="ds-sharepoint-incremental-sync"></a>

Konektor sumber data merayapi konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan basis pengetahuan Anda. Amazon Bedrock dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan merayapi konten yang berubah sejak sinkronisasi terakhir. Saat Anda menyinkronkan sumber data dengan basis pengetahuan untuk pertama kalinya, semua konten dirayapi secara default.

Untuk menyinkronkan sumber data Anda dengan basis pengetahuan Anda, gunakan [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)API atau pilih basis pengetahuan Anda di konsol dan pilih **Sinkronkan** dalam bagian ikhtisar sumber data.

**penting**  
Semua data yang Anda sinkronkan dari sumber data Anda akan tersedia bagi siapa saja yang memiliki `bedrock:Retrieve` izin untuk mengambil data. Ini juga dapat mencakup data apa pun dengan izin sumber data terkontrol. Untuk informasi selengkapnya, lihat [Izin basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html).

### Kredensial otentikasi rahasia
<a name="ds-sharepoint-secret-auth-credentials"></a>

Saat menggunakan otentikasi SharePoint App-Only, kredensyal autentikasi rahasia Anda harus menyertakan pasangan nilai kunci ini: AWS Secrets Manager 
+ `clientId`: *client ID associated with your Microsoft Entra SharePoint application*
+ `clientSecret`: *client secret associated with your Microsoft Entra SharePoint application*
+ `sharePointClientId`: *client ID generated when registering your SharePoint app for App-Only authentication*
+ `sharePointClientSecret`: *client secret generated when registering your SharePoint app for App-Only authentication*

**catatan**  
Rahasia Anda AWS Secrets Manager harus menggunakan Wilayah yang sama dari basis pengetahuan Anda.

------
#### [ Console ]

**Hubungkan SharePoint instans ke basis pengetahuan Anda**<a name="connect-sharepoint-console"></a>

1. Ikuti langkah-langkah di [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan pilih **SharePoint**sebagai sumber data.

1. Berikan nama dan deskripsi opsional untuk sumber data.

1. Berikan URL SharePoint situs Anda/URLs. Misalnya, untuk SharePoint Online,*https://yourdomain.sharepoint.com/sites/mysite*. URL Anda harus dimulai dengan *https* dan berisi*sharepoint.com*. URL situs Anda harus SharePoint situs yang sebenarnya, bukan *sharepoint.com/* atau *sites/mysite/home.aspx*

1. Berikan nama domain SharePoint instance Anda.

1. Di bagian **Pengaturan lanjutan**, Anda dapat secara opsional mengonfigurasi yang berikut:
   + **Kunci KMS untuk penyimpanan data sementara.** — Anda dapat mengenkripsi data sementara sambil mengubah data Anda menjadi embeddings dengan default atau kunci KMS Anda sendiri. Kunci yang dikelola AWS Untuk informasi selengkapnya, lihat [Enkripsi penyimpanan data sementara selama konsumsi data](encryption-kb.md#encryption-kb-ingestion).
   + **Kebijakan penghapusan data** — Anda dapat menghapus embeddings vektor untuk sumber data Anda yang disimpan di penyimpanan vektor secara default, atau memilih untuk menyimpan data penyimpanan vektor.

1. Berikan informasi otentikasi untuk terhubung ke SharePoint instans Anda. Untuk otentikasi SharePoint App-Only:

   1. Berikan ID penyewa. Anda dapat menemukan ID penyewa Anda di Properti portal Azure Active Directory Anda.

   1. Buka AWS Secrets Manager untuk menambahkan kredensyal rahasia Anda atau gunakan Nama Sumber Daya Amazon (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi ID SharePoint klien dan rahasia SharePoint klien yang dihasilkan saat Anda mendaftarkan App-Only di tingkat penyewa atau tingkat situs, dan ID klien Entra dan rahasia klien Entra yang dihasilkan saat Anda mendaftarkan aplikasi di Entra.

1. (Opsional) Di bagian **Parsing dan chunking konten**, Anda dapat menyesuaikan cara mengurai dan memotong data Anda. Lihat sumber daya berikut untuk mempelajari lebih lanjut tentang penyesuaian ini:
   + Untuk informasi selengkapnya tentang opsi penguraian, lihat[Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).
   + Untuk informasi lebih lanjut tentang strategi chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
**Awas**  
Anda tidak dapat mengubah strategi chunking setelah terhubung ke sumber data.
   + Untuk informasi selengkapnya tentang cara menyesuaikan potongan data dan pemrosesan metadata Anda dengan fungsi Lambda, lihat. [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md)

1. Pilih untuk menggunakan pola filters/regular ekspresi untuk menyertakan atau mengecualikan konten tertentu. Semua konten standar dirayapi sebaliknya.

1. Lanjutkan untuk memilih model embeddings dan penyimpanan vektor. Untuk melihat langkah-langkah yang tersisa, kembali ke [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan lanjutkan dari langkah setelah menghubungkan sumber data Anda.

------
#### [ API ]

Berikut ini adalah contoh konfigurasi untuk menghubungkan ke SharePoint Online untuk basis pengetahuan Amazon Bedrock Anda. Anda mengonfigurasi sumber data menggunakan API dengan AWS CLI atau SDK yang didukung, seperti Python. Setelah menelepon [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html), Anda menelepon [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)untuk membuat sumber data dengan informasi koneksi Anda di`dataSourceConfiguration`.

Untuk mempelajari tentang penyesuaian yang dapat Anda terapkan pada konsumsi dengan menyertakan bidang opsional`vectorIngestionConfiguration`, lihat. [Sesuaikan konsumsi untuk sumber data](kb-data-source-customize-ingestion.md)

**AWS Command Line Interface**

```
aws bedrock-agent create-data-source \
 --name "SharePoint Online connector" \
 --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE"
```

**Isi dari `sharepoint-bedrock-connector-configuration.json`**

```
{
    "sharePointConfiguration": {
        "sourceConfiguration": {
            "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de",
            "hostType": "ONLINE",
            "domain": "yourdomain",
            "siteUrls": [
                "https://yourdomain.sharepoint.com/sites/mysite"
            ],
            "authType": "OAUTH2_SHAREPOINT_APP_ONLY_CLIENT_CREDENTIALS",
            "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint"
        },
        "crawlerConfiguration": {
            "filterConfiguration": {
                "type": "PATTERN",
                "patternObjectFilter": {
                    "filters": [
                        {
                            "objectType": "File",
                            "inclusionFilters": [
                                ".*\\.pdf"
                            ],
                            "exclusionFilters": [
                                ".*private.*\\.pdf"
                            ]
                        }
                    ]
                }
            }
        }
    },
    "type": "SHAREPOINT"
}
```

------

**penting**  
Otentikasi OAuth2 .0 tidak disarankan. Kami menyarankan Anda menggunakan otentikasi SharePoint App-Only.

## Menggunakan OAuth2 .0
<a name="sharepoint-connector-oauth"></a>

Menggunakan OAuth 2.0, Anda dapat mengautentikasi dan mengotorisasi akses ke SharePoint sumber daya untuk SharePoint konektor yang terintegrasi dengan Basis Pengetahuan.

### Prasyarat
<a name="sharepoint-connector-oauth-prereq"></a>

**Dalam SharePoint, untuk otentikasi OAuth 2.0, pastikan Anda**:
+ Catat URL situs SharePoint online Anda/URLs. Misalnya, *https://yourdomain.sharepoint.com/sites/mysite*. URL Anda harus dimulai dengan *https* dan berisi*sharepoint.com*. URL situs Anda harus SharePoint situs yang sebenarnya, bukan *sharepoint.com/* atau *sites/mysite/home.aspx*
+ Catat nama domain URL instans SharePoint Online Anda/URLs.
+ Salin ID penyewa Microsoft 365 Anda. Anda dapat menemukan ID penyewa Anda di Properti portal Microsoft Entra Anda atau di aplikasi Anda OAuth.

  Catat nama pengguna dan kata sandi SharePoint akun admin, dan salin ID klien dan nilai rahasia klien saat mendaftarkan aplikasi.
**catatan**  
Untuk contoh aplikasi, lihat [Mendaftarkan aplikasi klien di Microsoft Entra ID](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) (sebelumnya dikenal sebagai Azure Active Directory) di situs web Microsoft Learn. 
+ Izin baca tertentu diperlukan untuk terhubung SharePoint saat Anda mendaftarkan aplikasi.
  + SharePoint: AllSites .Read (Delegated) - Baca item di semua koleksi situs
+ Anda mungkin perlu menonaktifkan **Default Keamanan** di portal Azure menggunakan pengguna admin. Untuk informasi selengkapnya tentang mengelola setelan default keamanan di portal Azure, lihat [dokumentasi Microsoft tentang cara mengamankan enable/disable default](https://learn.microsoft.com/en-us/microsoft-365/business-premium/m365bp-conditional-access?view=o365-worldwide&tabs=secdefaults#security-defaults-1).
+ Anda mungkin perlu menonaktifkan otentikasi multi-faktor (MFA) di SharePoint akun Anda, sehingga Amazon Bedrock tidak diblokir untuk merayapi konten Anda. SharePoint 

Untuk menyelesaikan prasyarat, pastikan Anda telah menyelesaikan langkah-langkahnya. [Akun AWS](#prerequisites-sharepoint-connector-account)

### Kredensial otentikasi rahasia
<a name="sharepoint-secret-auth-credentials-oauth"></a>

Untuk konfigurasi koneksi untuk OAuth2 .0, Anda dapat melakukan langkah yang sama untuk deteksi otomatis bidang dokumen utama, inclusion/exclusion filter, dan sinkronisasi inkremental seperti yang dijelaskan dalam. [Konfigurasi koneksi](#configuration-sharepoint-connector)

**Untuk otentikasi OAuth 2.0, kredensi otentikasi rahasia Anda AWS Secrets Manager harus menyertakan pasangan nilai** kunci ini.
+ `username`: *SharePoint admin username*
+ `password`: *SharePoint admin password*
+ `clientId`: *OAuth app client ID*
+ `clientSecret`: *OAuth app client secret*

### Hubungkan SharePoint instans ke basis pengetahuan Anda
<a name="sharepoint-connector-oauth-using"></a>

Untuk menghubungkan SharePoint instance ke basis pengetahuan Anda saat menggunakan OAuth2 .0:
+ (konsol) Di konsol, ikuti langkah yang sama seperti yang dijelaskan di [Connect SharePoint instance ke basis pengetahuan Anda](https://docs.aws.amazon.com/bedrock/latest/userguide/sharepoint-data-source-connector.html#connect-sharepoint-console). Bila Anda ingin memberikan informasi otentikasi untuk terhubung ke SharePoint instans Anda.
  + Berikan ID penyewa. Anda dapat menemukan ID penyewa Anda di Properti portal Azure Active Directory Anda.
  + Buka AWS Secrets Manager untuk menambahkan kredensyal otentikasi rahasia Anda atau gunakan Nama Sumber Daya Amazon (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi nama pengguna dan kata sandi SharePoint admin, serta ID klien aplikasi dan rahasia klien terdaftar Anda. Untuk contoh aplikasi, lihat [Mendaftarkan aplikasi klien di Microsoft Entra ID](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) (sebelumnya dikenal sebagai Azure Active Directory) di situs web Microsoft Learn.
+ (API) Berikut ini adalah contoh penggunaan `CreateDataSource` API untuk membuat sumber data Anda dengan informasi koneksi Anda untuk OAuth2 .0.

  ```
  aws bedrock-agent create-data-source \
   --name "SharePoint Online connector" \
   --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \
   --knowledge-base-id "your-knowledge-base-id" \
   --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \
   --data-deletion-policy "DELETE"
  ```

  **Isi dari `sharepoint-bedrock-connector-configuration.json`**

  ```
  {
      "sharePointConfiguration": {
          "sourceConfiguration": {
              "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de",
              "hostType": "ONLINE",
              "domain": "yourdomain",
              "siteUrls": [
                  "https://yourdomain.sharepoint.com/sites/mysite"
              ],
              "authType": "OAUTH2_CLIENT_CREDENTIALS",
              "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint"
          },
          "crawlerConfiguration": {
              "filterConfiguration": {
                  "type": "PATTERN",
                  "patternObjectFilter": {
                      "filters": [
                          {
                              "objectType": "File",
                              "inclusionFilters": [
                                  ".*\\.pdf"
                              ],
                              "exclusionFilters": [
                                  ".*private.*\\.pdf"
                              ]
                          }
                      ]
                  }
              }
          }
      },
      "type": "SHAREPOINT"
  }
  ```

# Connect to Salesforce untuk basis pengetahuan Anda
<a name="salesforce-data-source-connector"></a>

Salesforce adalah alat manajemen hubungan pelanggan (CRM) untuk mengelola tim dukungan, penjualan, dan pemasaran. [Anda dapat terhubung ke instans Salesforce untuk basis pengetahuan Amazon Bedrock Anda dengan menggunakan [AWS Management Console untuk Amazon Bedrock](https://console.aws.amazon.com/bedrock/home) atau API [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)(lihat Amazon Bedrock didukung dan). SDKs AWS CLI](https://docs.aws.amazon.com/bedrock/latest/APIReference/welcome.html)

**catatan**  
Konektor sumber data Salesforce dalam rilis pratinjau dan dapat berubah sewaktu-waktu.  
Sumber data Salesforce tidak mendukung data multimodal, seperti tabel, bagan, diagram, atau gambar lainnya.

Saat ini, hanya penyimpanan vektor Amazon OpenSearch Tanpa Server yang tersedia untuk digunakan dengan sumber data ini.

Ada batasan berapa banyak file dan MB per file yang dapat dirayapi. Lihat [Kuota untuk basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html).

**Topics**
+ [Fitur yang didukung](#supported-features-salesforce-connector)
+ [Prasyarat](#prerequisites-salesforce-connector)
+ [Konfigurasi koneksi](#configuration-salesforce-connector)

## Fitur yang didukung
<a name="supported-features-salesforce-connector"></a>
+ Deteksi otomatis bidang dokumen utama
+ Filter konten inklusi/pengecualian
+ Konten tambahan disinkronkan untuk konten yang ditambahkan, diperbarui, dihapus
+ OAuth 2.0 otentikasi

## Prasyarat
<a name="prerequisites-salesforce-connector"></a>

**Di Salesforce, pastikan Anda**:
+ Catat URL instance Salesforce Anda. Misalnya, *https://company.salesforce.com/*. Instans harus menjalankan Aplikasi Terhubung Salesforce.
+ Buat Aplikasi Terhubung Salesforce dan konfigurasikan kredensional klien. Kemudian, untuk aplikasi yang Anda pilih, salin kunci konsumen (ID klien) dan rahasia konsumen (rahasia klien) dari OAuth pengaturan. Untuk informasi selengkapnya, lihat Dokumentasi Salesforce tentang [Membuat Aplikasi Terhubung dan Mengonfigurasi Aplikasi](https://help.salesforce.com/s/articleView?id=sf.connected_app_create.htm&type=5) [Terhubung untuk Kredensyal Klien OAuth 2.0](https://help.salesforce.com/s/articleView?id=sf.connected_app_client_credentials_setup.htm&type=5).
**catatan**  
Untuk Salesforce Connected Apps, di bawah Client Credentials Flow, pastikan Anda mencari dan memilih nama pengguna atau alias untuk kredensyal klien Anda di bidang “Run As”.

**Di AWS akun Anda, pastikan Anda**:
+ Simpan kredensyal otentikasi Anda secara [AWS Secrets Manager rahasia dan catat Nama](https://docs.aws.amazon.com/secretsmanager/latest/userguide/create_secret.html) Sumber Daya Amazon (ARN) dari rahasianya. Ikuti petunjuk **konfigurasi Koneksi** di halaman ini untuk menyertakan pasangan nilai kunci yang harus disertakan dalam rahasia Anda.
+ Sertakan izin yang diperlukan untuk terhubung ke sumber data Anda dalam role/permissions kebijakan AWS Identity and Access Management (IAM) untuk basis pengetahuan Anda. Untuk informasi tentang izin yang diperlukan untuk sumber data ini untuk ditambahkan ke IAM peran basis pengetahuan Anda, lihat [Izin untuk mengakses sumber data](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html#kb-permissions-access-ds).

**catatan**  
Jika Anda menggunakan konsol, Anda dapat pergi ke AWS Secrets Manager untuk menambahkan rahasia Anda atau menggunakan rahasia yang ada sebagai bagian dari langkah konfigurasi sumber data. IAM Peran dengan semua izin yang diperlukan dapat dibuat untuk Anda sebagai bagian dari langkah konsol untuk membuat basis pengetahuan. Setelah Anda mengonfigurasi sumber data dan konfigurasi lainnya, IAM peran dengan semua izin yang diperlukan diterapkan ke basis pengetahuan khusus Anda.  
Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensil dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensi dan rahasia di seluruh sumber data.

## Konfigurasi koneksi
<a name="configuration-salesforce-connector"></a>

Untuk menyambung ke instans Salesforce, Anda harus memberikan informasi konfigurasi yang diperlukan agar Amazon Bedrock dapat mengakses dan meng-crawl data Anda. Anda juga harus mengikuti[Prasyarat](#prerequisites-salesforce-connector).

Contoh konfigurasi untuk sumber data ini disertakan dalam bagian ini.

Untuk informasi selengkapnya tentang deteksi otomatis bidang dokumen, inclusion/exclusion filter, sinkronisasi inkremental, kredensyal otentikasi rahasia, dan cara kerjanya, pilih yang berikut ini:

### Deteksi otomatis bidang dokumen utama
<a name="ds-salesforce-document-fields"></a>

Konektor sumber data secara otomatis mendeteksi dan merayapi semua bidang metadata utama dokumen atau konten Anda. Misalnya, konektor sumber data dapat merayapi badan dokumen yang setara dengan dokumen Anda, judul dokumen, tanggal pembuatan atau modifikasi dokumen, atau bidang inti lainnya yang mungkin berlaku untuk dokumen Anda.

**penting**  
Jika konten Anda menyertakan informasi sensitif, maka Amazon Bedrock dapat merespons menggunakan informasi sensitif.

Anda dapat menerapkan operator pemfilteran ke bidang metadata untuk membantu Anda lebih meningkatkan relevansi tanggapan. Misalnya, dokumentasikan “epoch\$1modification\$1time” atau jumlah detik yang berlalu 1 Januari 1970 untuk saat dokumen terakhir diperbarui. *Anda dapat memfilter data terbaru, di mana “epoch\$1modification\$1time” lebih besar dari angka tertentu.* Untuk informasi selengkapnya tentang operator pemfilteran yang dapat Anda terapkan ke bidang metadata, lihat [Metadata](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-test-config.html) dan pemfilteran.

### Filter inklusi/pengecualian
<a name="ds-salesforce-inclusion-exclusion"></a>

Anda dapat menyertakan atau mengecualikan perayapan konten tertentu. Misalnya, Anda dapat menentukan pola prefix/regular ekspresi pengecualian untuk melewatkan perayapan file apa pun yang berisi “pribadi” dalam nama file. Anda juga dapat menentukan pola prefix/regular ekspresi inklusi untuk menyertakan entitas konten atau jenis konten tertentu. Jika Anda menentukan filter penyertaan dan pengecualian dan keduanya cocok dengan dokumen, filter pengecualian akan diutamakan dan dokumen tidak dirayapi.

Contoh pola ekspresi reguler untuk mengecualikan atau memfilter kampanye yang berisi “pribadi” dalam nama kampanye:*”. \$1 pribadi. \$1”*

Anda dapat menerapkan inclusion/exclusion filter pada jenis konten berikut:
+ `Account`: Nomor akun/pengenal
+ `Attachment`: Nama file lampiran dengan ekstensinya
+ `Campaign`: Nama kampanye dan pengidentifikasi terkait
+ `ContentVersion`: Versi dokumen dan pengidentifikasi terkait
+ `Partner`: Bidang informasi mitra termasuk pengidentifikasi terkait
+ `Pricebook2`: nama Product/price daftar
+ `Case` inquiry/issue Nomor pelanggan dan bidang informasi lainnya termasuk pengidentifikasi terkait (harap dicatat: dapat berisi informasi pribadi, yang dapat Anda pilih untuk dikecualikan atau disaring)
+ `Contact`: Bidang informasi pelanggan (harap dicatat: dapat berisi informasi pribadi, yang dapat Anda pilih untuk dikecualikan atau disaring)
+ `Contract`: Nama kontrak dan pengidentifikasi terkait
+ `Document`: Nama file dengan ekstensinya
+ `Idea`: Bidang informasi ide dan pengidentifikasi terkait
+ `Lead`: Bidang informasi pelanggan baru yang potensial (harap dicatat: dapat berisi informasi pribadi, yang dapat Anda pilih untuk dikecualikan atau disaring)
+ `Opportunity`: Bidang sale/deal informasi yang tertunda dan pengidentifikasi terkait
+ `Product2`: Bidang informasi produk dan pengidentifikasi terkait
+ `Solution`: Nama solusi untuk pelanggan inquiry/issue dan pengidentifikasi terkait
+ `Task`: Bidang informasi tugas dan pengidentifikasi terkait
+ `FeedItem`: Pengidentifikasi posting umpan obrolan
+ `FeedComment`: Pengidentifikasi posting umpan obrolan yang menjadi milik komentar
+ `Knowledge__kav`: Judul Artikel Pengetahuan
+ `User`: Alias pengguna dalam organisasi Anda
+ `CollaborationGroup`: Nama grup obrolan (unik)

### Sinkronisasi inkremental
<a name="ds-salesforce-incremental-sync"></a>

Konektor sumber data merayapi konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan basis pengetahuan Anda. Amazon Bedrock dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan merayapi konten yang berubah sejak sinkronisasi terakhir. Saat Anda menyinkronkan sumber data dengan basis pengetahuan untuk pertama kalinya, semua konten dirayapi secara default.

Untuk menyinkronkan sumber data Anda dengan basis pengetahuan Anda, gunakan [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)API atau pilih basis pengetahuan Anda di konsol dan pilih **Sinkronkan** dalam bagian ikhtisar sumber data.

**penting**  
Semua data yang Anda sinkronkan dari sumber data Anda akan tersedia bagi siapa saja yang memiliki `bedrock:Retrieve` izin untuk mengambil data. Ini juga dapat mencakup data apa pun dengan izin sumber data terkontrol. Untuk informasi selengkapnya, lihat [Izin basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html).

### Kredensi otentikasi rahasia
<a name="ds-salesforce-secret-auth-credentials"></a>

(Untuk otentikasi OAuth 2.0) Kredensyal otentikasi rahasia Anda AWS Secrets Manager harus menyertakan pasangan nilai kunci ini:
+ `consumerKey`: *app client ID*
+ `consumerSecret`: *app client secret*
+ `authenticationUrl`: *Salesforce instance URL or the URL to request the authentication token from*

**catatan**  
Rahasia Anda AWS Secrets Manager harus menggunakan Wilayah yang sama dari basis pengetahuan Anda.

------
#### [ Console ]

**Hubungkan instans Salesforce ke basis pengetahuan Anda**

1. Ikuti langkah-langkah di [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan pilih **Salesforce** sebagai sumber data.

1. Berikan nama dan deskripsi opsional untuk sumber data.

1. Berikan URL instans Salesforce Anda. Misalnya, *https://company.salesforce.com/*. Instans harus menjalankan Aplikasi Terhubung Salesforce.

1. Di bagian **Pengaturan lanjutan**, Anda dapat secara opsional mengonfigurasi yang berikut:
   + **Kunci KMS untuk penyimpanan data sementara.** — Anda dapat mengenkripsi data sementara sambil mengubah data Anda menjadi embeddings dengan default atau kunci KMS Anda sendiri. Kunci yang dikelola AWS Untuk informasi selengkapnya, lihat [Enkripsi penyimpanan data sementara selama konsumsi data](encryption-kb.md#encryption-kb-ingestion).
   + **Kebijakan penghapusan data** — Anda dapat menghapus embeddings vektor untuk sumber data Anda yang disimpan di penyimpanan vektor secara default, atau memilih untuk menyimpan data penyimpanan vektor.

1. Berikan informasi autentikasi untuk terhubung ke instans Salesforce Anda:

   1. Untuk otentikasi OAuth 2.0, buka AWS Secrets Manager untuk menambahkan kredensyal otentikasi rahasia Anda atau gunakan Nama Sumber Daya Amazon (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi kunci konsumen Salesforce Connected App (ID klien), rahasia konsumen (rahasia klien), dan URL instans Salesforce atau URL untuk meminta token otentikasi. Untuk informasi selengkapnya, lihat Dokumentasi Salesforce tentang [Membuat Aplikasi Terhubung dan Mengonfigurasi Aplikasi](https://help.salesforce.com/s/articleView?id=sf.connected_app_create.htm&type=5) [Terhubung untuk Kredensyal Klien OAuth 2.0](https://help.salesforce.com/s/articleView?id=sf.connected_app_client_credentials_setup.htm&type=5).

1. (Opsional) Di bagian **Parsing dan chunking konten**, Anda dapat menyesuaikan cara mengurai dan memotong data Anda. Lihat sumber daya berikut untuk mempelajari lebih lanjut tentang penyesuaian ini:
   + Untuk informasi selengkapnya tentang opsi penguraian, lihat[Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).
   + Untuk informasi lebih lanjut tentang strategi chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
**Awas**  
Anda tidak dapat mengubah strategi chunking setelah terhubung ke sumber data.
   + Untuk informasi selengkapnya tentang cara menyesuaikan potongan data dan pemrosesan metadata Anda dengan fungsi Lambda, lihat. [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md)

1. Pilih untuk menggunakan pola filters/regular ekspresi untuk menyertakan atau mengecualikan konten tertentu. Jika tidak, semua konten standar akan dirayapi.

1. Lanjutkan untuk memilih model embeddings dan penyimpanan vektor. Untuk melihat langkah-langkah yang tersisa, kembali ke [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan lanjutkan dari langkah setelah menghubungkan sumber data Anda.

------
#### [ API ]

Berikut ini adalah contoh konfigurasi untuk menghubungkan ke Salesforce untuk basis pengetahuan Amazon Bedrock Anda. Anda mengonfigurasi sumber data menggunakan API dengan AWS CLI atau SDK yang didukung, seperti Python. Setelah menelepon [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html), Anda menelepon [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)untuk membuat sumber data dengan informasi koneksi Anda di`dataSourceConfiguration`.

Untuk mempelajari tentang penyesuaian yang dapat Anda terapkan pada konsumsi dengan menyertakan bidang opsional`vectorIngestionConfiguration`, lihat. [Sesuaikan konsumsi untuk sumber data](kb-data-source-customize-ingestion.md)

**AWS Command Line Interface**

```
aws bedrock create-data-source \
 --name "Salesforce connector" \
 --description "Salesforce data source connector for Amazon Bedrock to use content in Salesforce" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://salesforce-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}'

salesforce-bedrock-connector-configuration.json
{
    "salesforceConfiguration": {
        "sourceConfiguration": {
            "hostUrl": "https://company.salesforce.com/",
            "authType": "OAUTH2_CLIENT_CREDENTIALS",
            "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Salesforce"
        },
        "crawlerConfiguration": {
            "filterConfiguration": {
                "type": "PATTERN",
                "patternObjectFilter": {
                    "filters": [
                        {
                            "objectType": "Campaign",
                            "inclusionFilters": [
                                ".*public.*"
                            ],
                            "exclusionFilters": [
                                ".*private.*"
                            ]
                        }
                    ]
                }
            }
        }
    },
    "type": "SALESFORCE"
}
```

------

# Merayapi halaman web untuk basis pengetahuan Anda
<a name="webcrawl-data-source-connector"></a>

Amazon Bedrock menyediakan Web Crawler terhubung ke dan crawl yang telah URLs Anda pilih untuk digunakan di basis pengetahuan Amazon Bedrock Anda. Anda dapat merayapi halaman situs web sesuai dengan cakupan atau batasan yang ditetapkan untuk pilihan URLs Anda. Anda dapat merayapi halaman situs web menggunakan [Konsol AWS Manajemen untuk Amazon Bedrock](https://console.aws.amazon.com/bedrock/home) atau [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)API (lihat Amazon Bedrock [didukung SDKs ](https://docs.aws.amazon.com/bedrock/latest/APIReference/welcome.html) dan). AWS CLI Saat ini, hanya penyimpanan vektor Amazon OpenSearch Tanpa Server yang tersedia untuk digunakan dengan sumber data ini.

**catatan**  
Konektor sumber data Web Crawler dalam rilis pratinjau dan dapat berubah sewaktu-waktu.

Saat memilih situs web untuk dirayapi, Anda harus mematuhi [Kebijakan Penggunaan yang Dapat Diterima Amazon](https://aws.amazon.com/aup/) dan semua persyaratan Amazon lainnya. Ingat bahwa Anda hanya harus menggunakan Web Crawler untuk mengindeks halaman web Anda sendiri, atau halaman web yang Anda memiliki otorisasi untuk dirayapi dan harus menghormati konfigurasi robots.txt..

[Web Crawler menghormati robots.txt sesuai dengan RFC 9309](https://www.rfc-editor.org/rfc/rfc9309.html)

Ada batasan berapa banyak item konten halaman web dan MB per item konten yang dapat dirayapi. Lihat [Kuota untuk basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html).

**Topics**
+ [Fitur yang didukung](#supported-features-webcrawl-connector)
+ [Prasyarat](#prerequisites-webcrawl-connector)
+ [Konfigurasi koneksi](#configuration-webcrawl-connector)

## Fitur yang didukung
<a name="supported-features-webcrawl-connector"></a>

Web Crawler menghubungkan dan merayapi halaman HTML mulai dari URL benih, melintasi semua tautan anak di bawah domain dan jalur utama teratas yang sama. Jika salah satu halaman HTML mereferensikan dokumen yang didukung, Web Crawler akan mengambil dokumen-dokumen ini, terlepas dari apakah mereka berada dalam domain utama teratas yang sama. Anda dapat mengubah perilaku perayapan dengan mengubah konfigurasi crawling - lihat. [Konfigurasi koneksi](#configuration-webcrawl-connector)

Berikut ini didukung bagi Anda untuk:
+ Pilih beberapa sumber URLs untuk dirayapi dan atur cakupan URLs untuk meng-crawl hanya host atau juga menyertakan subdomain.
+ Merayapi halaman web statis yang merupakan bagian dari sumber URLs Anda.
+ Tentukan akhiran Agen Pengguna kustom untuk menetapkan aturan untuk crawler Anda sendiri.
+ Sertakan atau kecualikan tertentu URLs yang cocok dengan pola filter.
+ Hormati arahan robots.txt standar seperti 'Allow' dan 'Disallow'.
+ Batasi cakupan crawl dan secara opsional kecualikan URLs yang cocok dengan pola filter. URLs 
+ Batasi kecepatan crawling URLs dan jumlah maksimum halaman yang akan dirayapi.
+ Lihat status crawled URLs di Amazon CloudWatch

## Prasyarat
<a name="prerequisites-webcrawl-connector"></a>

**Untuk menggunakan Web Crawler, pastikan Anda:**.
+ Periksa apakah Anda berwenang untuk merayapi sumber URLs Anda.
+ Memeriksa jalur ke robots.txt yang sesuai dengan sumber Anda URLs tidak menghalangi agar tidak dirayapi. URLs Web Crawler mematuhi standar robots.txt: secara `disallow` default jika robots.txt tidak ditemukan untuk situs web. Web Crawler menghormati robots.txt sesuai dengan [RFC](https://www.rfc-editor.org/rfc/rfc9309.html) 9309. Anda juga dapat menentukan sufiks header Agen Pengguna kustom untuk menetapkan aturan untuk crawler Anda sendiri. Untuk informasi selengkapnya, lihat Akses URL Perayap Web dalam [Konfigurasi koneksi](#configuration-webcrawl-connector) petunjuk di halaman ini.
+ [Aktifkan pengiriman CloudWatch Log](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-bases-logging.html) dan ikuti contoh log Perayap Web untuk melihat status pekerjaan penyerapan data Anda untuk menelan konten web, dan jika tertentu URLs tidak dapat diambil.

**catatan**  
Saat memilih situs web untuk dirayapi, Anda harus mematuhi [Kebijakan Penggunaan yang Dapat Diterima Amazon](https://aws.amazon.com/aup/) dan semua persyaratan Amazon lainnya. Ingat bahwa Anda hanya harus menggunakan Web Crawler untuk mengindeks halaman web Anda sendiri, atau halaman web yang Anda memiliki otorisasi untuk dirayapi.

## Konfigurasi koneksi
<a name="configuration-webcrawl-connector"></a>

Untuk informasi selengkapnya tentang cakupan sinkronisasi untuk crawling URLs, inclusion/exclusion filter, akses URL, sinkronisasi inkremental, dan cara kerjanya, pilih yang berikut ini:

### Lingkup sinkronisasi untuk perayapan URLs
<a name="ds-sync-scope"></a>

Anda dapat membatasi cakupan crawl berdasarkan setiap hubungan spesifik URL halaman dengan seed URLs. URLs Untuk perayapan yang lebih cepat, Anda dapat membatasi URLs ke host yang sama dan jalur URL awal URL benih. Untuk crawl yang lebih luas, Anda dapat memilih untuk meng-crawl URLs dengan host yang sama atau dalam subdomain mana pun dari URL seed.

Anda dapat memilih dari opsi berikut.
+ Default: Batasi perayapan ke halaman web milik host yang sama dan dengan jalur URL awal yang sama. Misalnya, dengan URL benih "https://aws.amazon.com/bedrock/" maka hanya jalur dan halaman web yang memanjang dari jalur ini yang akan dirayapi, seperti "https://aws.amazon.com/bedrock/agen/”. Saudara URLs seperti "https://aws.amazon.com/ec2/" tidak merangkak, misalnya.
+ Hanya host: Batasi crawling ke halaman web milik host yang sama. Misalnya, dengan URL benih "https://aws.amazon.com/bedrock/“, maka halaman web dengan" https://aws.amazon.com "juga akan dirayapi, seperti" https://aws.amazon.com /ec2”.
+ Subdomain: Sertakan perayapan halaman web apa pun yang memiliki domain utama yang sama dengan URL benih. Misalnya, dengan URL benih "https://aws.amazon.com/bedrock/" maka halaman web apa pun yang berisi “amazon.com” (subdomain) akan dirayapi, seperti "”. https://www.amazon.com

**catatan**  
Pastikan Anda tidak merayapi halaman web yang berpotensi berlebihan. Tidak disarankan untuk merayapi situs web besar, seperti wikipedia.org, tanpa filter atau batasan cakupan. Merayapi situs web besar akan membutuhkan waktu yang sangat lama untuk dirayapi.  
[Jenis file yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html) dirayapi terlepas dari cakupannya dan jika tidak ada pola pengecualian untuk jenis file.

Web Crawler mendukung situs web statis.

Anda juga dapat membatasi laju perayapan URLs untuk mengontrol pelambatan kecepatan crawling. Anda mengatur jumlah maksimum URLs crawled per host per menit. Selain itu, Anda juga dapat mengatur jumlah maksimum (hingga 25.000) dari total halaman web untuk dirayapi. Perhatikan bahwa jika jumlah total halaman web dari sumber Anda URLs melebihi maksimum yang ditetapkan, maka sync/ingestion pekerjaan sumber data Anda akan gagal.

### Filter inklusi/pengecualian
<a name="ds-inclusion-exclusion"></a>

Anda dapat memasukkan atau mengecualikan tertentu sesuai URLs dengan ruang lingkup Anda. [Jenis file yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html) dirayapi terlepas dari cakupannya dan jika tidak ada pola pengecualian untuk jenis file. Jika Anda menentukan filter penyertaan dan pengecualian dan keduanya cocok dengan URL, filter pengecualian akan diutamakan dan konten web tidak dirayapi.

**penting**  
Filter pola ekspresi reguler bermasalah yang menyebabkan [bencana mundur](https://docs.aws.amazon.com/codeguru/detector-library/python/catastrophic-backtracking-regex/) dan melihat ke depan ditolak.

Contoh pola filter ekspresi reguler untuk mengecualikan akhir URLs itu dengan lampiran halaman web “.pdf” atau PDF: *“.\$1\$1 .pdf\$1*”

### Akses URL Perayap Web
<a name="ds-webcrawl-identity-crawling"></a>

Anda dapat menggunakan Web Crawler untuk merayapi halaman situs web yang diizinkan untuk dirayapi.

Saat memilih situs web untuk dirayapi, Anda harus mematuhi [Kebijakan Penggunaan yang Dapat Diterima Amazon](https://aws.amazon.com/aup/) dan semua persyaratan Amazon lainnya. Ingat bahwa Anda hanya harus menggunakan Web Crawler untuk mengindeks halaman web Anda sendiri, atau halaman web yang Anda memiliki otorisasi untuk dirayapi.

[Web Crawler menghormati robots.txt sesuai dengan RFC 9309](https://www.rfc-editor.org/rfc/rfc9309.html)

Anda dapat menentukan bot agen pengguna tertentu untuk 'Izinkan' atau 'Larang' agen pengguna untuk merayapi sumber Anda. URLs Anda dapat memodifikasi file robots.txt situs web Anda untuk mengontrol bagaimana Web Crawler merayapi sumber Anda. URLs Crawler pertama-tama akan mencari `bedrockbot-UUID ` aturan dan kemudian untuk `bedrockbot` aturan generik dalam file robots.txt.

Anda juga dapat menambahkan akhiran User-Agent yang dapat digunakan untuk mengizinkan crawler Anda dalam sistem perlindungan bot. Perhatikan bahwa akhiran ini tidak perlu ditambahkan ke `robots.txt` file untuk memastikan bahwa tidak ada yang dapat meniru string Agen Pengguna. Misalnya, untuk mengizinkan Perayap Web merayapi semua konten situs web dan melarang perayapan untuk robot lain, gunakan arahan berikut:

```
User-agent: bedrockbot-UUID # Amazon Bedrock Web Crawler
Allow: / # allow access to all pages
User-agent: * # any (other) robot
Disallow: / # disallow access to any pages
```

### Sinkronisasi inkremental
<a name="ds-incremental-sync"></a>

Setiap kali Web Crawler berjalan, ia mengambil konten untuk semua URLs yang dapat dijangkau dari sumber URLs dan yang cocok dengan lingkup dan filter. Untuk sinkronisasi tambahan setelah sinkronisasi pertama semua konten, Amazon Bedrock akan memperbarui basis pengetahuan Anda dengan konten baru dan yang dimodifikasi, dan akan menghapus konten lama yang tidak lagi ada. Kadang-kadang, crawler mungkin tidak dapat mengetahui apakah konten telah dihapus dari situs web; dan dalam hal ini akan salah di sisi melestarikan konten lama di basis pengetahuan Anda.

Untuk menyinkronkan sumber data Anda dengan basis pengetahuan Anda, gunakan [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)API atau pilih basis pengetahuan Anda di konsol dan pilih **Sinkronkan** dalam bagian ikhtisar sumber data.

**penting**  
Semua data yang Anda sinkronkan dari sumber data Anda akan tersedia bagi siapa saja yang memiliki `bedrock:Retrieve` izin untuk mengambil data. Ini juga dapat mencakup data apa pun dengan izin sumber data terkontrol. Untuk informasi selengkapnya, lihat [Izin basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html).

------
#### [ Console ]

**Connect sumber data Web Crawler ke basis pengetahuan Anda**

1. Ikuti langkah-langkah di [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan pilih **Web Crawler** sebagai sumber data.

1. Berikan nama dan deskripsi opsional untuk sumber data.

1. Berikan **Sumber URLs** yang ingin URLs Anda jelajahi. Anda dapat menambahkan hingga 9 tambahan URLs dengan memilih **Tambah Sumber URLs**. Dengan menyediakan URL sumber, Anda mengonfirmasi bahwa Anda berwenang untuk merayapi domainnya.

1. Di bagian **Pengaturan lanjutan**, Anda dapat secara opsional mengonfigurasi yang berikut:
   + **Kunci KMS untuk penyimpanan data sementara.** — Anda dapat mengenkripsi data sementara sambil mengubah data Anda menjadi embeddings dengan default atau kunci KMS Anda sendiri. Kunci yang dikelola AWS Untuk informasi selengkapnya, lihat [Enkripsi penyimpanan data sementara selama konsumsi data](encryption-kb.md#encryption-kb-ingestion).
   + **Kebijakan penghapusan data** — Anda dapat menghapus embeddings vektor untuk sumber data Anda yang disimpan di penyimpanan vektor secara default, atau memilih untuk menyimpan data penyimpanan vektor.

1. (Opsional) Berikan akhiran agen pengguna untuk **BedROCK-UUID-** yang mengidentifikasi crawler atau bot saat mengakses server web.

1. Konfigurasikan yang berikut ini di bagian **Lingkup sinkronisasi**:

   1. Pilih **rentang domain Situs web** untuk merayapi sumber Anda: URLs
      + Default: Batasi perayapan ke halaman web milik host yang sama dan dengan jalur URL awal yang sama. Misalnya, dengan URL benih "https://aws.amazon.com/bedrock/" maka hanya jalur dan halaman web yang memanjang dari jalur ini yang akan dirayapi, seperti "https://aws.amazon.com/bedrock/agen/”. Saudara URLs seperti "https://aws.amazon.com/ec2/" tidak merangkak, misalnya.
      + Hanya host: Batasi crawling ke halaman web milik host yang sama. Misalnya, dengan URL benih "https://aws.amazon.com/bedrock/“, maka halaman web dengan" https://aws.amazon.com "juga akan dirayapi, seperti" https://aws.amazon.com /ec2”.
      + Subdomain: Sertakan perayapan halaman web apa pun yang memiliki domain utama yang sama dengan URL benih. Misalnya, dengan URL benih "https://aws.amazon.com/bedrock/" maka halaman web apa pun yang berisi “amazon.com” (subdomain) akan dirayapi, seperti "”. https://www.amazon.com
**catatan**  
Pastikan Anda tidak merayapi halaman web yang berpotensi berlebihan. Tidak disarankan untuk merayapi situs web besar, seperti wikipedia.org, tanpa filter atau batasan cakupan. Merayapi situs web besar akan membutuhkan waktu yang sangat lama untuk dirayapi.  
[Jenis file yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html) dirayapi terlepas dari cakupannya dan jika tidak ada pola pengecualian untuk jenis file.

   1. Masukkan **pelambatan maksimum kecepatan perayapan**. Menelan URLs antara 1 dan 300 URLs per host per menit. Kecepatan merangkak yang lebih tinggi meningkatkan beban tetapi membutuhkan waktu lebih sedikit.

   1. Masukkan **halaman Maksimum untuk sinkronisasi sumber data** antara 1 dan 25000. Batasi jumlah maksimum halaman web yang dirayapi dari sumber URLs Anda. Jika halaman web melebihi angka ini, sinkronisasi sumber data akan gagal dan tidak ada halaman web yang akan dicerna. 

   1. Untuk pola **URL Regex** (opsional) Anda dapat menambahkan **pola Sertakan** atau **Kecualikan pola** dengan memasukkan pola ekspresi reguler di dalam kotak. Anda dapat menambahkan hingga 25 termasuk dan 25 mengecualikan pola filter dengan memilih **Tambahkan pola baru**. Pola include dan exclude dirayapi sesuai dengan cakupan Anda. Jika ada konflik, pola pengecualian diutamakan.

1. (Opsional) Di bagian **Parsing dan chunking konten**, Anda dapat menyesuaikan cara mengurai dan memotong data Anda. Lihat sumber daya berikut untuk mempelajari lebih lanjut tentang penyesuaian ini:
   + Untuk informasi selengkapnya tentang opsi penguraian, lihat[Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).
   + Untuk informasi lebih lanjut tentang strategi chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
**Awas**  
Anda tidak dapat mengubah strategi chunking setelah terhubung ke sumber data.
   + Untuk informasi selengkapnya tentang cara menyesuaikan potongan data dan pemrosesan metadata Anda dengan fungsi Lambda, lihat. [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md)

1. Lanjutkan untuk memilih model embeddings dan penyimpanan vektor. Untuk melihat langkah-langkah yang tersisa, kembali ke [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan lanjutkan dari langkah setelah menghubungkan sumber data Anda.

------
#### [ API ]

Untuk menghubungkan basis pengetahuan ke sumber data yang menggunakan WebCrawler, kirim [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt), tentukan `WEB` di `type` bidang [DataSourceConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DataSourceConfiguration.html), dan sertakan bidang. `webConfiguration` Berikut ini adalah contoh konfigurasi Web Crawler untuk basis pengetahuan Amazon Bedrock Anda.

```
{
    "webConfiguration": {
        "sourceConfiguration": {
            "urlConfiguration": {
                "seedUrls": [{
                    "url": "https://www.examplesite.com"
                }]
            }
        },
        "crawlerConfiguration": {
            "crawlerLimits": {
                "rateLimit": 50,
                "maxPages": 100
            },
            "scope": "HOST_ONLY",
            "inclusionFilters": [
                "https://www\.examplesite\.com/.*\.html"
            ],
            "exclusionFilters": [
                "https://www\.examplesite\.com/contact-us\.html"
            ],
            "userAgent": "CustomUserAgent"
        }
    },
    "type": "WEB"
}
```

Untuk mempelajari tentang penyesuaian yang dapat Anda terapkan pada konsumsi dengan menyertakan bidang opsional`vectorIngestionConfiguration`, lihat. [Sesuaikan konsumsi untuk sumber data](kb-data-source-customize-ingestion.md)

------

# Hubungkan basis pengetahuan Anda ke sumber data kustom
<a name="custom-data-source-connector"></a>

Alih-alih memilih layanan sumber data yang didukung, Anda dapat terhubung ke sumber data khusus untuk keuntungan berikut:
+ Fleksibilitas dan kontrol atas tipe data yang Anda inginkan untuk dapat diakses oleh basis pengetahuan Anda.
+ Kemampuan untuk menggunakan operasi `KnowledgeBaseDocuments` API untuk langsung menelan atau menghapus dokumen tanpa perlu menyinkronkan perubahan.
+ Kemampuan untuk melihat dokumen di sumber data Anda secara langsung melalui konsol Amazon Bedrock atau API.
+ Kemampuan untuk mengunggah dokumen ke sumber data langsung di Konsol Manajemen AWS atau menambahkannya sebaris.
+ Kemampuan untuk menambahkan metadata langsung ke setiap dokumen saat menambahkan atau memperbarui dokumen di sumber data. Untuk informasi selengkapnya tentang cara menggunakan metadata untuk memfilter saat mengambil informasi dari sumber data, lihat tab **Metadata** dan pemfilteran di. [Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md)

**Dukungan konten multimodal**  
Sumber data khusus mendukung konten multimodal termasuk gambar, audio, dan file video hingga 10MB base64 yang dikodekan. Untuk panduan komprehensif tentang bekerja dengan konten multimodal, lihat[Membangun basis pengetahuan untuk konten multimodal](kb-multimodal.md).

Untuk menghubungkan basis pengetahuan ke sumber data kustom, kirim [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Tentukan `knowledgeBaseId` basis pengetahuan yang akan dihubungkan, berikan `name` ke sumber data, dan tentukan `type` bidang di `dataSourceConfiguration` as`CUSTOM`. Berikut ini menunjukkan contoh minimal untuk membuat sumber data ini:

```
PUT /knowledgebases/KB12345678/datasources/ HTTP/1.1
Content-type: application/json

{
    "name": "MyCustomDataSource",
    "dataSourceConfiguration": {
        "type": "CUSTOM"
    }
}
```

Anda dapat menyertakan salah satu bidang opsional berikut untuk mengonfigurasi sumber data:


****  

| Bidang | Kasus penggunaan | 
| --- | --- | 
| deskripsi | Untuk memberikan deskripsi untuk sumber data. | 
| clientToken | Untuk memastikan permintaan API selesai hanya sekali. Untuk informasi selengkapnya, lihat [Memastikan idempotensi](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html). | 
| serverSideEncryptionKonfigurasi | Untuk menentukan kunci KMS kustom untuk penyimpanan data sementara saat mengubah data Anda menjadi embeddings. Untuk informasi selengkapnya, lihat [Enkripsi penyimpanan data sementara selama konsumsi data](encryption-kb.md#encryption-kb-ingestion) | 
| dataDeletionPolicy | Untuk mengonfigurasi apa yang harus dilakukan dengan penyematan vektor untuk sumber data Anda di penyimpanan vektor, jika Anda menghapus sumber data. Tentukan RETAIN untuk menyimpan data di penyimpanan vektor atau opsi default DELETE untuk menghapusnya. | 
| vectorIngestionConfiguration | Untuk mengkonfigurasi opsi untuk menelan sumber data. Lihat di bawah untuk informasi lebih lanjut. | 

`vectorIngestionConfiguration`Bidang memetakan ke [VectorIngestionConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorIngestionConfiguration.html)objek yang berisi bidang berikut:
+ ChunkingConfiguration — Untuk mengonfigurasi strategi yang akan digunakan untuk chunking dokumen di sumber data. Untuk informasi lebih lanjut tentang strategi chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
+ ParsingConfiguration — Untuk mengonfigurasi strategi yang akan digunakan untuk mengurai sumber data. Untuk informasi selengkapnya tentang opsi penguraian, lihat[Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).
+ customTransformationConfiguration — Untuk menyesuaikan bagaimana data diubah dan menerapkan fungsi Lambda untuk penyesuaian yang lebih besar. Untuk informasi selengkapnya tentang cara menyesuaikan potongan data dan pemrosesan metadata Anda dengan fungsi Lambda, lihat. [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md)

Setelah menyiapkan sumber data kustom Anda, Anda dapat menambahkan dokumen ke dalamnya dan langsung memasukkannya ke dalam basis pengetahuan. Tidak seperti sumber data lainnya, Anda tidak perlu menyinkronkan sumber data khusus. Untuk mempelajari cara menelan dokumen secara langsung, lihat[Ingest berubah langsung menjadi basis pengetahuan](kb-direct-ingestion.md).

# Sesuaikan konsumsi untuk sumber data
<a name="kb-data-source-customize-ingestion"></a>

Anda dapat menyesuaikan konsumsi vektor saat menghubungkan sumber data di Konsol Manajemen AWS atau dengan memodifikasi nilai `vectorIngestionConfiguration` bidang saat mengirim permintaan. [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)

Pilih topik untuk mempelajari cara menyertakan konfigurasi untuk menyesuaikan konsumsi saat menghubungkan ke sumber data:

**Topics**
+ [Pilih alat yang akan digunakan untuk parsing](#kb-data-source-customize-parsing)
+ [Pilih strategi chunking](#kb-data-source-customize-chunking)
+ [Gunakan fungsi Lambda selama konsumsi](#kb-data-source-customize-lambda)

## Pilih alat yang akan digunakan untuk parsing
<a name="kb-data-source-customize-parsing"></a>

Anda dapat menyesuaikan bagaimana dokumen dalam data Anda diuraikan. Untuk mempelajari opsi penguraian data di Pangkalan Pengetahuan Batuan Dasar Amazon, lihat. [Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md)

**Awas**  
Anda tidak dapat mengubah strategi parsing setelah terhubung ke sumber data. Untuk menggunakan strategi parsing yang berbeda, Anda dapat menambahkan sumber data baru.  
Anda tidak dapat menambahkan lokasi S3 untuk menyimpan data multimodal (termasuk gambar, gambar, bagan, dan tabel) setelah Anda membuat basis pengetahuan. Jika Anda ingin menyertakan data multimodal dan menggunakan parser yang mendukungnya, Anda harus membuat basis pengetahuan baru.

Langkah-langkah yang terlibat dalam memilih strategi parsing bergantung pada apakah Anda menggunakan Konsol Manajemen AWS atau Amazon Bedrock API dan metode parsing yang Anda pilih. Jika Anda memilih metode parsing yang mendukung data multimodal, Anda harus menentukan URI S3 untuk menyimpan data multimodal yang diekstrak dari dokumen Anda. Data ini dapat dikembalikan dalam kueri basis pengetahuan.
+ Dalam Konsol Manajemen AWS, lakukan hal berikut:

  1. Pilih strategi parsing saat Anda terhubung ke sumber data saat menyiapkan basis pengetahuan atau saat Anda menambahkan sumber data baru ke basis pengetahuan yang ada.

  1. (Jika Anda memilih Amazon Bedrock Data Automation atau model foundation sebagai strategi parsing Anda) Tentukan URI S3 untuk menyimpan data multimodal yang diekstrak dari dokumen Anda di bagian **tujuan penyimpanan multimodal saat Anda memilih model embeddings dan mengonfigurasi penyimpanan** vektor Anda. Anda juga dapat secara opsional menggunakan kunci yang dikelola pelanggan untuk mengenkripsi data S3 Anda pada langkah ini.
+ Di Amazon Bedrock API, lakukan hal berikut:

  1. (Jika Anda berencana untuk menggunakan Amazon Bedrock Data Automation atau model foundation sebagai strategi parsing Anda) Sertakan [SupplementalDataStorageLocation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_SupplementalDataStorageLocation.html)dalam [VectorKnowledgeBaseConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorKnowledgeBaseConfiguration.html)permintaan. [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html)

  1. Sertakan a [ParsingConfiguration[VectorIngestionConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorIngestionConfiguration.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ParsingConfiguration.html)di `parsingConfiguration` bidang [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)permintaan.
**catatan**  
Jika Anda menghilangkan konfigurasi ini, Pangkalan Pengetahuan Amazon Bedrock menggunakan parser default Amazon Bedrock.

Untuk detail selengkapnya tentang cara menentukan strategi parsing di API, perluas bagian yang sesuai dengan strategi parsing yang ingin Anda gunakan:

### Pengurai default Amazon Bedrock
<a name="w2aac28c10c23c15c17c11c13b1"></a>

Untuk menggunakan parser default, jangan sertakan `parsingConfiguration` bidang di dalam file. `VectorIngestionConfiguration`

### Pengurai Otomasi Data Batuan Dasar Amazon (pratinjau)
<a name="w2aac28c10c23c15c17c11c13b3"></a>

Untuk menggunakan parser Amazon Bedrock Data Automation, tentukan `BEDROCK_DATA_AUTOMATION` di `parsingStrategy` bidang `ParsingConfiguration` dan sertakan [BedrockDataAutomationConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_BedrockDataAutomationConfiguration.html)di `bedrockDataAutomationConfiguration` bidang, seperti dalam format berikut:

```
{
    "parsingStrategy": "BEDROCK_DATA_AUTOMATION",
    "bedrockDataAutomationConfiguration": {
        "parsingModality": "string"
    }
}
```

### Model pondasi
<a name="w2aac28c10c23c15c17c11c13b5"></a>

Untuk menggunakan model pondasi sebagai parser, tentukan `BEDROCK_FOUNDATION_MODEL` di `parsingStrategy` bidang `ParsingConfiguration` dan sertakan a [BedrockFoundationModelConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_BedrockFoundationModelConfiguration.html)di `bedrockFoundationModelConfiguration` lapangan, seperti dalam format berikut:

```
{
    "parsingStrategy": "BEDROCK_FOUNDATION_MODEL",
    "bedrockFoundationModelConfiguration": {
        "modelArn": "string",
        "parsingModality": "string",
        "parsingPrompt": {
            "parsingPromptText": "string"
        }
    }
}
```

## Pilih strategi chunking
<a name="kb-data-source-customize-chunking"></a>

Anda dapat menyesuaikan bagaimana dokumen dalam data Anda dipotong untuk penyimpanan dan pengambilan. Untuk mempelajari opsi untuk memotong data di Pangkalan Pengetahuan Amazon Bedrock, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)

**Awas**  
Anda tidak dapat mengubah strategi chunking setelah terhubung ke sumber data.

Dalam Konsol Manajemen AWS Anda memilih strategi chunking saat menghubungkan ke sumber data. Dengan Amazon Bedrock API, Anda menyertakan a [ChunkingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ChunkingConfiguration.html)di `chunkingConfiguration` bidang. [VectorIngestionConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorIngestionConfiguration.html)

**catatan**  
Jika Anda menghilangkan konfigurasi ini, Amazon Bedrock membagi konten Anda menjadi potongan sekitar 300 token, sambil mempertahankan batas kalimat.

Perluas bagian yang sesuai dengan strategi parsing yang ingin Anda gunakan:

### Tidak ada chunking
<a name="w2aac28c10c23c15c17c13c13b1"></a>

Untuk memperlakukan setiap dokumen dalam sumber data Anda sebagai potongan sumber tunggal, tentukan `NONE` di `chunkingStrategy` bidang`ChunkingConfiguration`, seperti dalam format berikut:

```
{
    "chunkingStrategy": "NONE"
}
```

### Potongan ukuran tetap
<a name="w2aac28c10c23c15c17c13c13b3"></a>

Untuk membagi setiap dokumen di sumber data Anda menjadi potongan-potongan dengan ukuran yang kira-kira sama, tentukan `FIXED_SIZE` di `chunkingStrategy` bidang `ChunkingConfiguration` dan sertakan a [FixedSizeChunkingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_FixedSizeChunkingConfiguration.html)di `fixedSizeChunkingConfiguration` bidang, seperti dalam format berikut:

```
{
    "chunkingStrategy": "FIXED_SIZE",
    "fixedSizeChunkingConfiguration": {
        "maxTokens": number,
        "overlapPercentage": number
    }
}
```

### Chunking hierarkis
<a name="w2aac28c10c23c15c17c13c13b5"></a>

Untuk membagi setiap dokumen dalam sumber data Anda menjadi dua tingkat, di mana lapisan kedua berisi potongan kecil yang berasal dari lapisan pertama, tentukan `HIERARCHICAL` di `chunkingStrategy` bidang `ChunkingConfiguration` dan sertakan `hierarchicalChunkingConfiguration` bidang, seperti dalam format berikut:

```
{
    "chunkingStrategy": "HIERARCHICAL",
    "hierarchicalChunkingConfiguration": {
        "levelConfigurations": [{
            "maxTokens": number
        }],
        "overlapTokens": number
    }
}
```

### Chunking semantik
<a name="w2aac28c10c23c15c17c13c13b7"></a>

Untuk membagi setiap dokumen dalam sumber data Anda menjadi potongan-potongan yang memprioritaskan makna semantik di atas struktur sintaksis, tentukan `SEMANTIC` di bidang `ChunkingConfiguration` dan sertakan `chunkingStrategy` bidang, seperti dalam format berikut`semanticChunkingConfiguration`:

```
{
    "chunkingStrategy": "SEMANTIC",
    "semanticChunkingConfiguration": {
        "breakpointPercentileThreshold": number,
        "bufferSize": number,
        "maxTokens": number
    }
}
```

## Gunakan fungsi Lambda selama konsumsi
<a name="kb-data-source-customize-lambda"></a>

Anda dapat memposting proses bagaimana potongan sumber dari data Anda ditulis ke penyimpanan vektor dengan fungsi Lambda dengan cara berikut:
+ Sertakan logika chunking untuk memberikan strategi chunking khusus.
+ Sertakan logika untuk menentukan metadata tingkat potongan.

Untuk mempelajari cara menulis fungsi Lambda khusus untuk konsumsi, lihat. [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md) Di dalam Konsol Manajemen AWS Anda memilih fungsi Lambda saat menghubungkan ke sumber data. Dengan Amazon Bedrock API, Anda menyertakan a [CustomTransformationConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CustomTransformationConfiguration.html)di `CustomTransformationConfiguration` bidang [VectorIngestionConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorIngestionConfiguration.html)dan menentukan ARN Lambda, seperti dalam format berikut:

```
{
    "transformations": [{
        "transformationFunction": {
            "transformationLambdaConfiguration": {
                "lambdaArn": "string"
            }
        },
        "stepToApply": "POST_CHUNKING"
    }],
    "intermediateStorage": {
        "s3Location": {
            "uri": "string"
        }
    }
}
```

Anda juga menentukan lokasi S3 untuk menyimpan output setelah menerapkan fungsi Lambda.

Anda dapat menyertakan `chunkingConfiguration` bidang untuk menerapkan fungsi Lambda setelah menerapkan salah satu opsi chunking yang ditawarkan Amazon Bedrock.

# Siapkan konfigurasi keamanan untuk basis pengetahuan Anda
<a name="kb-create-security"></a>

Setelah membuat basis pengetahuan, Anda mungkin harus menyiapkan konfigurasi keamanan berikut:

**Topics**
+ [Menyiapkan kebijakan akses data untuk basis pengetahuan Anda](#kb-create-security-data)
+ [Menyiapkan kebijakan akses jaringan untuk basis pengetahuan Amazon OpenSearch Tanpa Server](#kb-create-security-network)

## Menyiapkan kebijakan akses data untuk basis pengetahuan Anda
<a name="kb-create-security-data"></a>

Jika Anda menggunakan [peran khusus](kb-permissions.md), siapkan konfigurasi keamanan untuk basis pengetahuan yang baru dibuat. Jika Anda membiarkan Amazon Bedrock membuat peran layanan untuk Anda, Anda dapat melewati langkah ini. Ikuti langkah-langkah di tab yang sesuai dengan database yang Anda atur.

------
#### [ Amazon OpenSearch Serverless ]

Untuk membatasi akses ke koleksi Amazon OpenSearch Tanpa Server ke peran layanan basis pengetahuan, buat kebijakan akses data. Anda dapat melakukannya dengan cara-cara berikut:
+ Gunakan konsol OpenSearch Layanan Amazon dengan mengikuti langkah-langkah di [Membuat kebijakan akses data (konsol)](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-data-access.html#serverless-data-access-console) di Panduan Pengembang OpenSearch Layanan Amazon.
+ Gunakan AWS API dengan mengirimkan [CreateAccessPolicy](https://docs.aws.amazon.com/opensearch-service/latest/ServerlessAPIReference/API_CreateAccessPolicy.html)permintaan dengan titik akhir [OpenSearch Tanpa Server](https://docs.aws.amazon.com/general/latest/gr/opensearch-service.html#opensearch-service-regions). AWS CLISebagai contoh, lihat [Membuat kebijakan akses data (AWS CLI)](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-data-access.html#serverless-data-access-cli).

Gunakan kebijakan akses data berikut, yang menentukan koleksi Amazon OpenSearch Tanpa Server dan peran layanan Anda:

```
[
    {
        "Description": "${data access policy description}",
        "Rules": [
          {
            "Resource": [
              "index/${collection_name}/*"
            ],
            "Permission": [
                "aoss:DescribeIndex",
                "aoss:ReadDocument",
                "aoss:WriteDocument"
            ],
            "ResourceType": "index"
          }
        ],
        "Principal": [
            "arn:aws:iam::${account-id}:role/${kb-service-role}"
        ]
    }
]
```

------
#### [ Biji pinus, Awan Perusahaan Redis or MongoDB Atlas ]

Untuk mengintegrasikanPinecone,Redis Enterprise Cloud, indeks vektor MongoDB Atlas, lampirkan kebijakan berbasis identitas berikut ke peran layanan basis pengetahuan Anda untuk memungkinkannya mengakses rahasia untuk indeks vektor. AWS Secrets Manager

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [{
        "Effect": "Allow",
        "Action": [
            "bedrock:AssociateThirdPartyKnowledgeBase"
        ],
        "Resource": "*",
        "Condition": {
            "StringEquals": {
                "bedrock:ThirdPartyKnowledgeBaseCredentialsSecretArn": "arn:aws:secretsmanager:us-east-1:123456789012:secret:${secret-id}"
            }
        }
    }]
}
```

------

------

## Menyiapkan kebijakan akses jaringan untuk basis pengetahuan Amazon OpenSearch Tanpa Server
<a name="kb-create-security-network"></a>

Jika Anda menggunakan koleksi Amazon OpenSearch Tanpa Server pribadi untuk basis pengetahuan Anda, itu hanya dapat diakses melalui titik akhir VPCAWS PrivateLink. Anda dapat membuat koleksi Amazon OpenSearch Tanpa Server pribadi saat [menyiapkan koleksi vektor Amazon OpenSearch Tanpa Server atau membuat koleksi Amazon Tanpa](knowledge-base-setup.md) OpenSearch Server yang ada (termasuk yang dibuat oleh konsol Amazon Bedrock untuk Anda) saat mengonfigurasi kebijakan akses jaringannya.

Sumber daya berikut dalam Panduan Pengembang OpenSearch Layanan Amazon akan membantu Anda memahami penyiapan yang diperlukan untuk koleksi Private Amazon OpenSearch Tanpa Server:
+ Untuk informasi selengkapnya tentang menyiapkan titik akhir VPC untuk koleksi Amazon Tanpa OpenSearch Server pribadi, lihat Mengakses [Amazon OpenSearch ](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vpc.html) Tanpa Server menggunakan titik akhir antarmuka (). AWS PrivateLink
+ Untuk informasi selengkapnya tentang kebijakan akses jaringan di Amazon OpenSearch Tanpa Server, lihat [Akses jaringan untuk Amazon OpenSearch ](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-network.html) Tanpa Server.

Untuk mengizinkan basis pengetahuan Amazon Bedrock mengakses koleksi Amazon OpenSearch Tanpa Server pribadi, Anda harus mengedit kebijakan akses jaringan untuk koleksi Amazon Tanpa OpenSearch Server untuk mengizinkan Amazon Bedrock sebagai layanan sumber. Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

1. Buka konsol OpenSearch Layanan Amazon di [https://console.aws.amazon.com/aos/](https://console.aws.amazon.com/aos/).

1. Dari panel navigasi kiri, pilih **Koleksi**. Kemudian pilih koleksi Anda.

1. Di bagian **Jaringan**, pilih **Kebijakan Terkait**.

1. Pilih **Edit**.

1. Untuk **memilih metode definisi kebijakan**, lakukan salah satu hal berikut:
   + Biarkan **Pilih metode definisi kebijakan** sebagai **Editor visual** dan konfigurasikan pengaturan berikut di bagian **Aturan 1**:

     1. (Opsional) Di bidang **Nama aturan**, masukkan nama untuk aturan akses jaringan.

     1. Di bawah **Akses koleksi dari**, pilih **Pribadi (disarankan)**.

     1. Pilih **AWSlayanan akses pribadi**. Di kotak teks, masukkan**bedrock.amazonaws.com**.

     1. Batalkan pilihan **Aktifkan akses ke OpenSearch Dasbor**.
   + Pilih **JSON** dan tempel kebijakan berikut di editor **JSON**.

     ```
     [
         {                                        
             "AllowFromPublic": false,
             "Description":"${network access policy description}",
             "Rules":[
                 {
                     "ResourceType": "collection",
                     "Resource":[
                         "collection/${collection-id}"
                     ]
                 }
             ],
             "SourceServices":[
                 "bedrock.amazonaws.com"
             ]
         }
     ]
     ```

1. Pilih **Perbarui**.

------
#### [ API ]

Untuk mengedit kebijakan akses jaringan untuk koleksi Amazon OpenSearch Tanpa Server Anda, lakukan hal berikut:

1. Kirim [GetSecurityPolicy](https://docs.aws.amazon.com/opensearch-service/latest/ServerlessAPIReference/API_GetSecurityPolicy.html)permintaan dengan titik akhir [OpenSearch Tanpa Server](https://docs.aws.amazon.com/general/latest/gr/opensearch-service.html#opensearch-service-regions). Tentukan `name` kebijakan dan tentukan `type` sebagai`network`. Catat `policyVersion` dalam respons.

1. Kirim [UpdateSecurityPolicy](https://docs.aws.amazon.com/opensearch-service/latest/ServerlessAPIReference/API_UpdateSecurityPolicy.html)permintaan dengan titik akhir [OpenSearch Tanpa Server](https://docs.aws.amazon.com/general/latest/gr/opensearch-service.html#opensearch-service-regions). Minimal, tentukan bidang-bidang berikut:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/kb-create-security.html)

   ```
   [
       {                                        
           "AllowFromPublic": false,
           "Description":"${network access policy description}",
           "Rules":[
               {
                   "ResourceType": "collection",
                   "Resource":[
                       "collection/${collection-id}"
                   ]
               }
           ],
           "SourceServices":[
               "bedrock.amazonaws.com"
           ]
       }
   ]
   ```

AWS CLISebagai contoh, lihat [Membuat kebijakan akses data (AWS CLI)](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-data-access.html#serverless-data-access-cli).

------
+ Gunakan konsol OpenSearch Layanan Amazon dengan mengikuti langkah-langkah di [Membuat kebijakan jaringan (konsol)](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-network.html#serverless-network-console). Alih-alih membuat kebijakan jaringan, perhatikan **kebijakan terkait** di subbagian **Jaringan** dari rincian koleksi.

# Sinkronkan data Anda dengan basis pengetahuan Amazon Bedrock Anda
<a name="kb-data-source-sync-ingest"></a>

Setelah Anda membuat basis pengetahuan Anda, Anda menelan atau menyinkronkan data Anda sehingga data dapat ditanyakan. Ingestion mengubah data mentah di sumber data Anda menjadi embeddings vektor, berdasarkan model penyematan vektor dan konfigurasi yang Anda tentukan.

Sebelum Anda mulai menelan, periksa apakah sumber data Anda memenuhi kondisi berikut:
+ Anda telah mengonfigurasi informasi koneksi untuk sumber data Anda. Untuk mengonfigurasi konektor sumber data untuk merayapi data dari repositori sumber data, lihat Konektor sumber [data yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html). Anda mengonfigurasi sumber data Anda sebagai bagian dari pembuatan basis pengetahuan Anda.
+ Anda telah mengonfigurasi model penyematan vektor dan penyimpanan vektor pilihan Anda. Lihat [model penyematan vektor yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-supported.html) dan [penyimpanan vektor untuk](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html) basis pengetahuan. Anda mengonfigurasi penyematan vektor Anda sebagai bagian dari pembuatan basis pengetahuan Anda.
+ File dalam format yang didukung. Untuk informasi selengkapnya, lihat [Format dokumen Dukungan](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html#kb-ds-supported-doc-formats-limits).
+ File tidak melebihi **ukuran file pekerjaan Ingestion** yang ditentukan di [titik akhir Amazon Bedrock dan](https://docs.aws.amazon.com/general/latest/gr/bedrock.html) kuota di. Referensi Umum AWS
+ Jika sumber data Anda berisi file metadata, periksa kondisi berikut untuk memastikan bahwa file metadata tidak diabaikan:
  + Setiap `.metadata.json` file berbagi nama file dan ekstensi yang sama dengan file sumber yang terkait dengannya.
  + Jika indeks vektor untuk basis pengetahuan Anda ada di penyimpanan vektor Amazon OpenSearch Tanpa Server, periksa apakah indeks vektor dikonfigurasi dengan mesin. `faiss` Jika indeks vektor dikonfigurasi dengan `nmslib` mesin, Anda harus melakukan salah satu hal berikut:
    + [Buat basis pengetahuan baru](knowledge-base-create.md) di konsol dan biarkan Amazon Bedrock secara otomatis membuat indeks vektor di Amazon OpenSearch Tanpa Server untuk Anda.
    + [Buat indeks vektor lain](knowledge-base-setup.md) di toko vektor dan pilih `faiss` sebagai **Mesin**. Kemudian [buat basis pengetahuan baru](knowledge-base-create.md) dan tentukan indeks vektor baru.
  + Jika indeks vektor untuk basis pengetahuan Anda berada di kluster database Amazon Aurora, sebaiknya gunakan bidang metadata khusus untuk menyimpan semua metadata Anda dalam satu kolom dan membuat indeks di kolom ini. Jika Anda tidak menyediakan bidang metadata kustom, Anda harus memeriksa bahwa tabel untuk indeks Anda berisi kolom untuk setiap properti metadata dalam file metadata Anda sebelum memulai konsumsi. Untuk informasi selengkapnya, lihat [Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan](knowledge-base-setup.md).

Setiap kali Anda menambahkan, memodifikasi, atau menghapus file dari sumber data Anda, Anda harus menyinkronkan sumber data sehingga diindeks ulang ke basis pengetahuan. Sinkronisasi bersifat bertahap, jadi Amazon Bedrock hanya memproses dokumen yang ditambahkan, dimodifikasi, atau dihapus sejak sinkronisasi terakhir.

Untuk mempelajari cara memasukkan data Anda ke dalam basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk menyerap data Anda ke dalam basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda**

1. Buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock/](https://console.aws.amazon.com/bedrock/).

1. Dari panel navigasi kiri, pilih **Basis pengetahuan dan pilih basis** pengetahuan Anda.

1. Di bagian **Sumber data**, pilih **Sinkronkan** untuk memulai konsumsi data atau menyinkronkan data terbaru Anda. Untuk menghentikan sinkronisasi sumber data yang saat ini, pilih **Berhenti**. Sumber data saat ini harus disinkronkan untuk menghentikan sinkronisasi sumber data. Anda dapat memilih **Sinkronkan** lagi untuk menyerap sisa data Anda.

1. Ketika konsumsi data selesai, spanduk sukses hijau muncul jika berhasil.
**catatan**  
Setelah sinkronisasi data selesai, mungkin diperlukan beberapa menit agar penyematan vektor data yang baru disinkronkan tercermin dalam basis pengetahuan Anda dan tersedia untuk kueri jika Anda menggunakan penyimpanan vektor selain Amazon Aurora (RDS).

1. Anda dapat memilih sumber data untuk melihat **riwayat Sinkronisasi**. Pilih **Lihat peringatan** untuk melihat mengapa pekerjaan penyerapan data gagal.

------
#### [ API ]

Untuk memasukkan data Anda ke basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda, kirim [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)permintaan dengan titik akhir waktu [build Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Tentukan `knowledgeBaseId` dan`dataSourceId`. Anda juga dapat menghentikan pekerjaan penyerapan data yang sedang berjalan dengan mengirimkan permintaan. [StopIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StopIngestionJob.html) Tentukan`dataSourceId`,`ingestionJobId`, dan`knowledgeBaseId`. Pekerjaan penyerapan data harus sedang berjalan untuk menghentikan konsumsi data. Anda dapat mengirim `StartIngestionJob` permintaan lagi untuk menelan sisa data Anda saat Anda siap.

Gunakan yang `ingestionJobId` dikembalikan dalam respons dalam [GetIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html)permintaan dengan [titik akhir waktu build Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) untuk melacak status pekerjaan konsumsi. Selain itu, tentukan `knowledgeBaseId` dan`dataSourceId`.
+ Ketika pekerjaan konsumsi selesai, responsnya adalah`status`. `COMPLETE`
**catatan**  
Setelah penyerapan data selesai, mungkin diperlukan beberapa menit agar penyematan vektor dari data yang baru dicerna tersedia di penyimpanan vektor untuk kueri jika Anda menggunakan penyimpanan vektor selain Amazon Aurora (RDS).
+ `statistics`Objek dalam respons mengembalikan informasi tentang apakah konsumsi berhasil atau tidak untuk dokumen dalam sumber data.

Anda juga dapat melihat informasi untuk semua pekerjaan konsumsi untuk sumber data dengan mengirimkan [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html)permintaan dengan titik akhir waktu pembuatan [Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Tentukan `dataSourceId` `knowledgeBaseId` dan basis pengetahuan tempat data dicerna.
+ Filter untuk hasil dengan menentukan status untuk mencari di `filters` objek.
+ Urutkan berdasarkan waktu pekerjaan dimulai atau status pekerjaan dengan menentukan `sortBy` objek. Anda dapat mengurutkan dalam urutan naik atau turun.
+ Mengatur jumlah maksimum hasil untuk kembali dalam respon di `maxResults` lapangan. Jika ada lebih banyak hasil daripada nomor yang Anda tetapkan, respons akan mengembalikan permintaan `nextToken` yang dapat Anda kirim dalam [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html)permintaan lain untuk melihat kumpulan pekerjaan berikutnya.

------

# Ingest berubah langsung menjadi basis pengetahuan
<a name="kb-direct-ingestion"></a>

Amazon Bedrock Knowledge Bases memungkinkan Anda untuk memodifikasi sumber data Anda dan menyinkronkan perubahan dalam satu langkah. Anda dapat memanfaatkan fitur ini jika basis pengetahuan Anda terhubung ke salah satu jenis sumber data berikut:
+ Amazon S3
+ Kustom

Dengan konsumsi langsung, Anda dapat langsung menambahkan, memperbarui, atau menghapus file dalam basis pengetahuan dalam satu tindakan dan basis pengetahuan Anda dapat memiliki akses ke dokumen tanpa perlu menyinkronkan. Direct ingestion menggunakan operasi `KnowledgeBaseDocuments` API untuk mengindeks dokumen yang Anda kirimkan langsung ke penyimpanan vektor yang disiapkan untuk basis pengetahuan. Anda juga dapat melihat dokumen di basis pengetahuan Anda secara langsung dengan operasi ini, daripada perlu menavigasi ke sumber data yang terhubung untuk melihatnya.

## Perbedaan dari sinkronisasi sumber data
<a name="kb-direct-ingestion-sync-diff"></a>

Amazon Bedrock Knowledge Bases juga menawarkan serangkaian operasi `IngestionJob` API yang berhubungan dengan [sinkronisasi sumber data Anda](kb-data-source-sync-ingest.md). Saat Anda menyinkronkan sumber data dengan [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)permintaan, Pangkalan Pengetahuan Amazon Bedrock memindai setiap dokumen di sumber data yang terhubung dan memverifikasi apakah sudah diindeks ke penyimpanan vektor yang disiapkan untuk basis pengetahuan. Jika belum, itu akan diindeks ke dalam penyimpanan vektor.

Dengan [IngestKnowledgeBaseDocuments](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_IngestKnowledgeBaseDocuments.html)permintaan, Anda mengirimkan array dokumen untuk langsung diindeks ke penyimpanan vektor. Oleh karena itu, Anda melewatkan langkah menambahkan dokumen ke sumber data. Lihat paragraf berikut untuk memahami kasus penggunaan untuk dua set operasi API ini:

**Jika Anda menggunakan sumber data khusus**  
Anda tidak perlu menyinkronkan atau menggunakan `IngestionJob` operasi. Dokumen yang Anda tambahkan, modifikasi, atau hapus dengan `KnowledgeBaseDocuments` operasi atau Konsol Manajemen AWS menjadi bagian dari sumber data kustom dan basis pengetahuan Anda.

**Jika Anda menggunakan sumber data Amazon S3**  
Anda menggunakan dua set operasi dalam kasus penggunaan yang berbeda:
+ Setelah menghubungkan basis pengetahuan ke sumber data S3 untuk pertama kalinya, Anda harus menyinkronkan sumber data Anda di Konsol Manajemen AWS atau dengan mengirimkan [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)permintaan melalui Amazon Bedrock API.
+ Indeks dokumen ke dalam penyimpanan vektor yang disiapkan untuk basis pengetahuan Anda atau hapus dokumen yang diindeks dengan cara berikut:

  1. Tambahkan dokumen ke lokasi S3 Anda atau hapus dokumen darinya. Kemudian sinkronkan sumber data Anda di Konsol Manajemen AWS atau kirimkan `StartIngestionJob` permintaan di API. Untuk detail tentang sinkronisasi dan `StartIngestionJob` operasi, lihat[Sinkronkan data Anda dengan basis pengetahuan Amazon Bedrock Anda](kb-data-source-sync-ingest.md).

  1. Menyerap dokumen S3 ke dalam basis pengetahuan secara langsung dengan permintaan. `IngestKnowledgeBaseDocuments` Untuk detail tentang menelan dokumen secara langsung, lihat[Menyerap dokumen langsung ke basis pengetahuan](kb-direct-ingestion-add.md).
**Awas**  
Untuk sumber data S3, perubahan apa pun yang Anda indeks ke basis pengetahuan secara langsung di Konsol Manajemen AWS atau dengan operasi `KnowledgeBaseDocuments` API tidak tercermin di lokasi S3. Anda dapat menggunakan operasi API ini untuk membuat perubahan pada basis pengetahuan Anda segera tersedia dalam satu langkah. Namun, Anda harus menindaklanjuti dengan membuat perubahan yang sama di lokasi S3 Anda sehingga tidak ditimpa saat berikutnya Anda menyinkronkan sumber data Anda di Konsol Manajemen AWS atau dengan. `StartIngestionJob`  
Jangan mengirimkan `IngestKnowledgeBaseDocuments` dan `StartIngestionJob` meminta pada saat yang bersamaan.

Pilih topik untuk mempelajari cara melakukan konsumsi langsung dokumen di sumber data Anda:

**Topics**
+ [Perbedaan dari sinkronisasi sumber data](#kb-direct-ingestion-sync-diff)
+ [Prasyarat untuk konsumsi langsung](kb-direct-ingestion-prereq.md)
+ [Menyerap dokumen langsung ke basis pengetahuan](kb-direct-ingestion-add.md)
+ [Melihat informasi tentang dokumen di sumber data Anda](kb-direct-ingestion-view.md)
+ [Hapus dokumen dari basis pengetahuan secara langsung](kb-direct-ingestion-delete.md)

# Prasyarat untuk konsumsi langsung
<a name="kb-direct-ingestion-prereq"></a>

Untuk menggunakan direct ingestion, peran IAM harus memiliki izin untuk menggunakan operasi API. `KnowledgeBaseDocs` Jika peran IAM Anda memiliki kebijakan [AmazonBedrockFullAccess](security-iam-awsmanpol.md#security-iam-awsmanpol-AmazonBedrockFullAccess)AWSterkelola yang dilampirkan, Anda dapat melewati bagian ini.

Kebijakan berikut dapat dilampirkan ke peran IAM untuk memungkinkannya melakukan konsumsi langsung pada basis pengetahuan yang Anda tentukan di lapangan. `Resource`

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "DirectIngestion",
            "Effect": "Allow",
            "Action": [
                "bedrock:StartIngestionJob",
                "bedrock:IngestKnowledgeBaseDocuments",
                "bedrock:GetKnowledgeBaseDocuments",
                "bedrock:ListKnowledgeBaseDocuments",
                "bedrock:DeleteKnowledgeBaseDocuments"
            ],
            "Resource": [
                "arn:aws:bedrock:us-east-1:123456789012:knowledge-base/${KnowledgeBaseId}"
            ]
        }
    ]
}
```

------

Untuk membatasi izin lebih lanjut, Anda dapat menghilangkan tindakan, atau Anda dapat menentukan sumber daya dan kunci kondisi untuk memfilter izin. Untuk informasi selengkapnya tentang tindakan, sumber daya, dan kunci kondisi, lihat topik berikut di *Referensi Otorisasi Layanan*:
+ [Tindakan yang ditentukan oleh Amazon Bedrock](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-actions-as-permissions) — Pelajari tentang tindakan, jenis sumber daya yang dapat Anda cakupannya di `Resource` bidang, dan kunci kondisi tempat Anda dapat memfilter izin di `Condition` bidang.
+ [Jenis sumber daya yang ditentukan oleh Amazon Bedrock](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-resources-for-iam-policies) — Pelajari tentang jenis sumber daya di Amazon Bedrock.
+ [Kunci kondisi untuk Amazon Bedrock](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-policy-keys) - Pelajari tentang kunci kondisi di Amazon Bedrock.

# Menyerap dokumen langsung ke basis pengetahuan
<a name="kb-direct-ingestion-add"></a>

Topik ini menjelaskan cara mencerna dokumen langsung ke basis pengetahuan. Pembatasan berlaku untuk jenis dokumen yang dapat Anda konsumsi langsung tergantung pada sumber data Anda. Lihat tabel berikut untuk pembatasan metode yang dapat Anda gunakan untuk menentukan dokumen yang akan dicerna:


****  

| Jenis sumber data | Dokumen didefinisikan secara in-line | Dokumen di lokasi Amazon S3 | 
| --- | --- | --- | 
| Amazon S3 | ![\[Red circular icon with an X symbol, indicating cancellation or denial.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-no.png)Tidak | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | 
| Khusus | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | 

Perluas bagian yang sesuai dengan kasus penggunaan Anda:

**catatan**  
Saat Anda menggunakan konsol, Anda dapat menelan hingga 10 dokumen langsung ke basis pengetahuan Anda. Jika Anda menggunakan `IngestKnowledgeBaseDocuments` API sebagai gantinya, Anda dapat memasukkan hingga 25 dokumen ke dalam basis pengetahuan Anda. Untuk informasi selengkapnya tentang kuota ini, lihat [kuota layanan Amazon Bedrock di panduan Referensi AWS](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) *Umum*.

## Gunakan konsol
<a name="kb-direct-ingestion-add-console"></a>

Untuk menambah atau memodifikasi dokumen secara langsung di Konsol Manajemen AWS, lakukan hal berikut:

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, pilih basis pengetahuan untuk mencerna dokumen.

1. Di bagian **Sumber data**, pilih sumber data yang ingin Anda tambahkan, ubah, atau hapus dokumen.

1. Di bagian **Dokumen**, pilih **Tambahkan dokumen**. Kemudian, lakukan salah satu hal berikut:
   + Untuk menambahkan atau memodifikasi dokumen secara langsung, pilih **Tambahkan dokumen secara langsung**. Kemudian, lakukan hal berikut:

     1. Di bidang **Pengenal dokumen**, tentukan nama unik untuk dokumen tersebut. Jika Anda menentukan nama yang sudah ada di sumber data, dokumen akan diganti.

     1. Untuk mengunggah dokumen, pilih **Unggah**. Untuk menentukan dokumen sebaris, pilih **Tambahkan dokumen sebaris**, pilih format, dan masukkan teks dokumen di dalam kotak.

     1. (Opsional) Untuk mengaitkan metadata dengan dokumen, pilih **Tambahkan metadata** dan masukkan kunci, ketik, dan nilai.
   + Untuk menambah atau memodifikasi dokumen dengan menentukan lokasi S3-nya, pilih **Tambahkan dokumen S3**. Kemudian, lakukan hal berikut:

     1. Di bidang **Pengenal dokumen**, tentukan nama unik untuk dokumen tersebut. Jika Anda menentukan nama yang sudah ada di sumber data, dokumen akan diganti.

     1. Tentukan apakah **lokasi S3** dokumen ada di AWS akun Anda saat ini atau yang lain. Kemudian tentukan URI S3 dokumen.

     1. (Opsional) Untuk mengaitkan metadata dengan dokumen, pilih sumber **Metadata**. Tentukan URI S3 dari metadata atau pilih **Tambahkan metadata** dan masukkan kunci, ketik, dan nilai.

1. **Untuk mencerna dokumen dan metadata terkait, pilih Tambah.**

## Gunakan API
<a name="kb-direct-ingestion-add-api"></a>

Untuk memasukkan dokumen secara langsung ke basis pengetahuan menggunakan Amazon Bedrock API, kirim [IngestKnowledgeBaseDocuments](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_IngestKnowledgeBaseDocuments.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) dan tentukan ID basis pengetahuan dan sumber data yang terhubung dengannya.

**catatan**  
Jika Anda menentukan pengenal dokumen atau lokasi S3 yang sudah ada di basis pengetahuan, dokumen akan ditimpa dengan konten baru.

Badan permintaan berisi satu bidang,`documents`, yang memetakan ke array [KnowledgeBaseDocument](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_KnowledgeBaseDocument.html)objek, yang masing-masing mewakili konten dan metadata opsional dokumen untuk ditambahkan ke sumber data dan untuk diserap ke dalam basis pengetahuan. Sebuah [KnowledgeBaseDocument](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_KnowledgeBaseDocument.html)objek berisi bidang-bidang berikut:
+ konten — Peta ke [DocumentContent](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentContent.html)objek yang berisi informasi tentang isi dokumen yang akan ditambahkan.
+ metadata — (Opsional) Memetakan ke [DocumentMetadata](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentMetadata.html)objek yang berisi informasi tentang metadata dokumen yang akan ditambahkan. Untuk informasi selengkapnya tentang cara menggunakan metadata selama pengambilan, lihat bagian **Metadata dan pemfilteran** di. [Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md)

Pilih topik untuk mempelajari cara menelan dokumen untuk tipe sumber data yang berbeda atau untuk melihat contoh:

**Topics**
+ [Menyerap dokumen ke dalam basis pengetahuan yang terhubung ke sumber data khusus](#kb-direct-ingestion-add-custom)
+ [Menyerap dokumen ke dalam basis pengetahuan yang terhubung ke sumber data Amazon S3](#kb-direct-ingestion-add-s3)
+ [Contoh badan permintaan](#w2aac28c10c23c19c17c11b3c19)

### Menyerap dokumen ke dalam basis pengetahuan yang terhubung ke sumber data khusus
<a name="kb-direct-ingestion-add-custom"></a>

Jika yang `dataSourceId` Anda tentukan milik sumber data kustom, Anda dapat menambahkan konten dan metadata untuk setiap [KnowledgeBaseDocument](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_KnowledgeBaseDocument.html)objek dalam array. `documents`

Isi dokumen yang ditambahkan ke sumber data kustom dapat didefinisikan dengan cara berikut:

#### Tentukan dokumen secara in-line
<a name="kb-direct-ingestion-add-custom-inline"></a>

Anda dapat menentukan jenis dokumen berikut secara in-line:

------
#### [ Text ]

Jika dokumen adalah teks, [DocumentContent](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentContent.html)objek harus dalam format berikut:

```
{ 
    "custom": { 
        "customDocumentIdentifier": { 
            "id": "string"
        },
        "inlineContent": { 
            "textContent": { 
                "data": "string"
            },
            "type": "TEXT"
        },
        "sourceType": "IN_LINE"
    },
    "dataSourceType": "CUSTOM"
}
```

Sertakan ID untuk dokumen di `id` bidang dan teks dokumen di `data` lapangan.

------
#### [ Bytes ]

Jika dokumen berisi lebih dari teks, ubah menjadi Base64-String. [DocumentContent](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentContent.html)Objek kemudian harus dalam format berikut:

```
{ 
    "custom": { 
        "customDocumentIdentifier": { 
            "id": "string"
        },
        "inlineContent": { 
            "byteContent": { 
                "data": blob,
                "mimeType": "string"
            },
            "type": "BYTE"
        },
        "sourceType": "IN_LINE"
    },
    "dataSourceType": "CUSTOM"
}
```

Sertakan ID untuk dokumen di `id` bidang, dokumen yang dikodekan Base64 di `data` bidang, dan tipe MIME di bidang. `mimeType`

------

#### Menelan dokumen dari S3
<a name="w2aac28c10c23c19c17c11b3c15b7b3"></a>

Jika Anda menelan dokumen dari lokasi S3, [DocumentContent](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentContent.html)objek di `content` bidang harus dari bentuk berikut:

```
{ 
    "custom": { 
        "customDocumentIdentifier": { 
            "id": "string"
        },
        "s3Location": { 
            "bucketOwnerAccountId": "string",
            "uri": "string"
        },
        "sourceType": "S3"
    },
    "dataSourceType": "CUSTOM"
}
```

Sertakan ID untuk dokumen di `id` bidang, pemilik bucket S3 yang berisi dokumen di `bucketOwnerAccountId` bidang, dan URI S3 dokumen di `uri` bidang.

Metadata untuk dokumen dapat didefinisikan dengan cara berikut:

#### Tentukan metadata in-line
<a name="w2aac28c10c23c19c17c11b3c15c11b1"></a>

Jika Anda mendefinisikan metadata inline, [DocumentMetadata](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentMetadata.html)objek di `metadata` bidang harus dalam format berikut:

```
{ 
    "inlineAttributes": [ 
        { 
            "key": "string",
            "value": { 
                "stringValue": "string",
                "booleanValue": boolean,
                "numberValue": number,
                "stringListValue": [ "string" ],
                "type": "STRING" | "BOOLEAN" | "NUMBER" | "STRING_LIST"
            }
        }
    ],
    "type": "IN_LINE_ATTRIBUTE"
}
```

Untuk setiap atribut yang Anda tambahkan, tentukan kunci di `key` bidang. Tentukan tipe data dari nilai di `type` bidang dan sertakan bidang yang sesuai dengan tipe data. Misalnya, jika Anda menyertakan string, atribut akan dalam format berikut:

```
{ 
    "key": "string",
    "value": { 
        "stringValue": "string",
        "type": "STRING"
    }
}
```

#### Menelan metadata dari S3
<a name="w2aac28c10c23c19c17c11b3c15c11b3"></a>

Anda juga dapat menelan metadata dari file dengan ekstensi `.metadata.json` di lokasi S3. Untuk informasi selengkapnya tentang format file metadata, lihat bagian Bidang **metadata dokumen** di. [Connect ke Amazon S3 untuk basis pengetahuan Anda](s3-data-source-connector.md)

Jika metadata berasal dari file S3, [DocumentMetadata](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentMetadata.html)objek di `metadata` bidang harus dalam format berikut:

```
{
    "s3Location": { 
        "bucketOwnerAccountId": "string",
        "uri": "string"
    },
        "type": "S3_LOCATION"
    }
 }
```

Sertakan pemilik bucket S3 yang berisi file metadata di `bucketOwnerAccountId` bidang, dan URI S3 dari file metadata di bidang. `uri`

**Awas**  
Jika Anda mendefinisikan konten sebaris, Anda harus menentukan metadata inline.

### Menyerap dokumen ke dalam basis pengetahuan yang terhubung ke sumber data Amazon S3
<a name="kb-direct-ingestion-add-s3"></a>

Jika yang `dataSourceId` Anda tentukan milik sumber data S3, Anda dapat menambahkan konten dan metadata untuk setiap [KnowledgeBaseDocument](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_KnowledgeBaseDocument.html)objek dalam array. `documents`

**catatan**  
Untuk sumber data S3, Anda dapat menambahkan konten dan metadata hanya dari lokasi S3.

Isi dokumen S3 untuk ditambahkan ke S3 harus ditambahkan ke [DocumentContent](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentContent.html)objek dalam format berikut:

```
{ 
    "dataSourceType": "string",
    "s3": { 
        "s3Location": { 
            "uri": "string"
        }
    }
}
```

Sertakan pemilik bucket S3 yang berisi dokumen di `bucketOwnerAccountId` bidang, dan URI S3 dokumen di `uri` bidang.

Metadata untuk dokumen yang ditambahkan ke sumber data kustom dapat didefinisikan dalam format berikut:

```
{
    "s3Location": { 
        "bucketOwnerAccountId": "string",
        "uri": "string"
    },
        "type": "S3_LOCATION"
    }
 }
```

**Awas**  
Dokumen yang Anda konsumsi langsung ke basis pengetahuan yang terhubung ke sumber data S3 tidak ditambahkan ke bucket S3 itu sendiri. Kami menyarankan Anda menambahkan dokumen-dokumen ini ke sumber data S3 juga sehingga tidak dihapus atau ditimpa jika Anda menyinkronkan sumber data Anda.

### Contoh badan permintaan
<a name="w2aac28c10c23c19c17c11b3c19"></a>

Perluas bagian berikut untuk melihat badan permintaan untuk kasus penggunaan yang berbeda dengan`IngestKnowledgeBaseDocuments`:

#### Tambahkan dokumen teks khusus ke sumber data khusus dan konsumsi
<a name="w2aac28c10c23c19c17c11b3c19b5b1"></a>

Contoh berikut menunjukkan penambahan satu dokumen teks ke sumber data kustom:

```
PUT /knowledgebases/KB12345678/datasources/DS12345678/documents HTTP/1.1
Content-type: application/json

{
   "documents": [ 
      { 
         "content": { 
            "dataSourceType": "CUSTOM",
            "custom": { 
               "customDocumentIdentifier": { 
                  "id": "MyDocument"
               },
               "inlineContent": { 
                  "textContent": { 
                     "data": "Hello world!"
                  },
                  "type": "TEXT"
               },
               "sourceType": "IN_LINE"
            }
         }
     }
   ]
}
```

#### Tambahkan dokumen yang dikodekan Base64 ke sumber data khusus dan konsumsi
<a name="w2aac28c10c23c19c17c11b3c19b5b3"></a>

Contoh berikut menunjukkan penambahan dokumen PDF ke sumber data kustom:

```
PUT /knowledgebases/KB12345678/datasources/DS12345678/documents HTTP/1.1
Content-type: application/json

{
   "documents": [ 
      { 
         "content": { 
            "dataSourceType": "CUSTOM",
            "custom": { 
               "customDocumentIdentifier": { 
                  "id": "MyDocument"
               },
               "inlineContent": { 
                  "byteContent": { 
                     "data": "<Base64-encoded string>",
                     "mimeType": "application/pdf"
                  },
                  "type": "BYTE"
               },
               "sourceType": "IN_LINE"
            }
         }
     }
   ]
}
```

#### Tambahkan dokumen dari lokasi S3 ke basis pengetahuan yang terhubung ke sumber data khusus dan menelannya
<a name="w2aac28c10c23c19c17c11b3c19b5b5"></a>

Contoh berikut menunjukkan penambahan satu dokumen teks ke sumber data kustom dari lokasi S3:

```
PUT /knowledgebases/KB12345678/datasources/DS12345678/documents HTTP/1.1
Content-type: application/json

{
   "documents": [ 
      { 
         "content": { 
            "dataSourceType": "CUSTOM",
            "custom": { 
               "customDocumentIdentifier": { 
                  "id": "MyDocument"
               },
               "s3": {
                "s3Location": {
                    "uri": "amzn-s3-demo-bucket"
                }
               },
               "sourceType": "S3"
            }
         }
     }
   ]
}
```

#### Tambahkan dokumen inline ke basis pengetahuan yang terhubung ke sumber data kustom dan sertakan metadata inline
<a name="w2aac28c10c23c19c17c11b3c19b5b7"></a>

Contoh berikut menunjukkan penambahan inline ke sumber data kustom dokumen bersama metadata yang berisi dua atribut:

```
PUT /knowledgebases/KB12345678/datasources/DS12345678/documents HTTP/1.1
Content-type: application/json

{
   "documents": [ 
      { 
         "content": { 
            "dataSourceType": "CUSTOM",
            "custom": { 
               "customDocumentIdentifier": { 
                  "id": "MyDocument"
               },
               "inlineContent": { 
                  "textContent": { 
                     "data": "Hello world!"
                  },
                  "type": "TEXT"
               },
               "sourceType": "IN_LINE"
            }
         },
         "metadata": {
            "inlineAttributes": [ 
               { 
                  "key": "genre",
                  "value": {
                     "stringValue": "pop",
                     "type": "STRING"
                  }
               },
               { 
                  "key": "year",
                  "value": { 
                     "numberValue": 1988,
                     "type": "NUMBER"
                  }
               }
            ],
            "type": "IN_LINE_ATTRIBUTE"
         }
     }
   ]
}
```

#### Tambahkan dokumen ke basis pengetahuan yang terhubung ke sumber data S3 dan sertakan metadata untuknya
<a name="w2aac28c10c23c19c17c11b3c19b5b9"></a>

Contoh berikut menunjukkan penambahan dokumen bersama metadata ke sumber data S3. Anda dapat memasukkan metadata hanya melalui S3:

```
PUT /knowledgebases/KB12345678/datasources/DS12345678/documents HTTP/1.1
Content-type: application/json

{
    "documents": [ 
        { 
            "content": { 
                "dataSourceType": "S3",
                "s3": { 
                "s3Location": {
                    "uri": "amzn-s3-demo-bucket"
                }
            }
        },
        "metadata": {
            "s3Location": {
                "bucketOwnerId": "111122223333",
                "uri": "amzn-s3-demo-bucket"
            },
                "type": "S3_LOCATION"
            }
        }
    ]
}
```

# Melihat informasi tentang dokumen di sumber data Anda
<a name="kb-direct-ingestion-view"></a>

Topik berikut menjelaskan cara melihat dokumen di sumber data Anda. Jika basis pengetahuan Anda terhubung ke sumber data Amazon S3, Anda dapat melihat dokumen di bucket S3 yang terhubung.

**catatan**  
Jika Anda membuat basis pengetahuan baru dengan menghubungkan ke sumber data S3, Anda harus menyinkronkan sumber data terlebih dahulu sebelum dapat menggunakan operasi API ini pada sumber data.

Perluas metode yang sesuai dengan kasus penggunaan Anda:

## Gunakan konsol
<a name="kb-direct-ingestion-view-console"></a>

Untuk melihat dokumen di sumber data Anda yang telah tertelan Konsol Manajemen AWS, lakukan hal berikut:

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, pilih basis pengetahuan yang dokumennya ingin Anda lihat.

1. Di bagian **Sumber data**, pilih sumber data yang dokumennya ingin Anda lihat.

1. Bagian **Dokumen** mencantumkan dokumen di sumber data. Dokumen-dokumen ini juga telah dicerna ke dalam basis pengetahuan.

## Gunakan API
<a name="kb-direct-ingestion-view-api"></a>

Dengan Amazon Bedrock API, Anda dapat melihat subset atau semua dokumen di sumber data Anda yang telah dicerna ke dalam basis pengetahuan. Pilih topik yang berkaitan dengan kasus penggunaan Anda.

**Topics**
+ [Melihat informasi tentang subset dokumen di basis pengetahuan Anda](#kb-direct-ingestion-get)
+ [Lihat informasi tentang semua dokumen di basis pengetahuan Anda](#kb-direct-ingestion-list)

### Melihat informasi tentang subset dokumen di basis pengetahuan Anda
<a name="kb-direct-ingestion-get"></a>

Untuk melihat informasi tentang dokumen tertentu di sumber data Anda, kirim [GetKnowledgeBaseDocuments](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetKnowledgeBaseDocuments.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) dan tentukan sumber data dan basis pengetahuan yang terhubung dengannya. IDs 

Untuk setiap dokumen yang ingin Anda dapatkan informasinya, tambahkan [DocumentIdentifier](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentIdentifier.html)item dalam `documentIdentifiers` array dalam salah satu format berikut:
+ Jika sumber data adalah kustom, tentukan ID dokumen di `id` bidang:

  ```
  { 
      "custom": { 
          "id": "string"
      },
      "dataSourceType": "CUSTOM"
  }
  ```
+ Jika sumber data adalah Amazon S3, tentukan URI S3 dokumen di bidang: `uri`

  ```
  {
      "dataSourceType": "S3",
      "s3": { 
          "uri": "string"
      }
  }
  ```

Respons mengembalikan array item, yang masing-masing berisi informasi tentang dokumen yang Anda minta.

### Lihat informasi tentang semua dokumen di basis pengetahuan Anda
<a name="kb-direct-ingestion-list"></a>

Untuk melihat informasi tentang semua dokumen dalam sumber data, kirim [ListKnowledgeBaseDocuments](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListKnowledgeBaseDocuments.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) dan tentukan sumber data dan basis pengetahuan yang terhubung dengannya. IDs Anda juga memiliki opsi berikut:
+ Tentukan `maxResults` untuk membatasi jumlah hasil yang akan dikembalikan.
+ Jika hasilnya tidak sesuai dengan respons, nilai dikembalikan di `nextToken` bidang respons. Anda dapat menggunakan nilai ini di `nextToken` bidang permintaan berikutnya untuk mendapatkan kumpulan hasil berikutnya.

# Hapus dokumen dari basis pengetahuan secara langsung
<a name="kb-direct-ingestion-delete"></a>

Jika Anda tidak lagi memerlukan dokumen di basis pengetahuan Anda, Anda dapat menghapusnya secara langsung. Untuk mempelajari cara menghapus dokumen dari sumber data dan basis pengetahuan Anda, perluas bagian yang sesuai dengan kasus penggunaan Anda:

## Gunakan konsol
<a name="kb-direct-ingestion-delete-console"></a>

Untuk menghapus dokumen dari sumber data dan basis pengetahuan Anda secara langsung menggunakan Konsol Manajemen AWS, lakukan hal berikut:

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, pilih basis pengetahuan untuk menghapus dokumen.

1. Di bagian **Sumber data**, pilih sumber data untuk menghapus dokumen.

1. Di bagian **Dokumen**, pilih dokumen yang akan dihapus. Kemudian pilih **Hapus dokumen**. Tinjau pesan dan konfirmasi.

## Gunakan API
<a name="kb-direct-ingestion-delete-api"></a>

Untuk menghapus dokumen tertentu dari sumber data Anda melalui Amazon Bedrock API, kirim [DeleteKnowledgeBaseDocuments](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DeleteKnowledgeBaseDocuments.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) dan tentukan sumber data dan basis pengetahuan yang terhubung dengannya. IDs 

Untuk setiap dokumen yang ingin Anda hapus, tambahkan [DocumentIdentifier](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DocumentIdentifier.html)item dalam `documentIdentifiers` array dalam salah satu format berikut:
+ Jika sumber data adalah kustom, tentukan ID dokumen di `id` bidang:

  ```
  { 
      "custom": { 
          "id": "string"
      },
      "dataSourceType": "CUSTOM"
  }
  ```
+ Jika sumber data adalah Amazon S3, tentukan URI S3 dokumen di bidang: `uri`

  ```
  {
      "dataSourceType": "S3",
      "s3": { 
          "uri": "string"
      }
  }
  ```

**Awas**  
Dokumen yang Anda hapus langsung dari basis pengetahuan yang terhubung ke sumber data S3 tidak akan dihapus dari bucket S3 itu sendiri. Kami menyarankan Anda menghapus dokumen-dokumen ini dari bucket S3, sehingga dokumen tersebut tidak diperkenalkan kembali jika Anda menyinkronkan sumber data Anda.

# Lihat informasi sumber data untuk basis pengetahuan Amazon Bedrock Anda
<a name="kb-ds-info"></a>

Anda dapat melihat informasi tentang sumber data untuk basis pengetahuan Anda, seperti pengaturan dan riwayat sinkronisasi.

Untuk memantau basis pengetahuan Anda, termasuk sumber data apa pun untuk basis pengetahuan Anda, lihat [Pencatatan basis pengetahuan menggunakan Amazon CloudWatch](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-bases-logging.html).

Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk melihat informasi tentang sumber data**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Sumber data**, pilih sumber data yang ingin Anda lihat detailnya.

1. **Ikhtisar sumber data** berisi detail tentang sumber data.

1. **Riwayat Sinkronisasi** berisi detail tentang kapan sumber data disinkronkan. Untuk melihat alasan mengapa peristiwa sinkronisasi gagal, pilih acara sinkronisasi dan pilih **Lihat peringatan**.

------
#### [ API ]

Untuk mendapatkan informasi tentang sumber data, kirim [GetDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetDataSource.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) dan tentukan `dataSourceId` dan basis pengetahuan `knowledgeBaseId` yang dimilikinya.

Untuk mencantumkan informasi tentang sumber data basis pengetahuan, kirim [ListDataSources](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListDataSources.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock dan tentukan ID basis](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) pengetahuan.
+ Untuk mengatur jumlah hasil maksimum yang akan dikembalikan dalam respons, gunakan `maxResults` bidang.
+ Jika ada lebih banyak hasil daripada angka yang Anda tetapkan, respons mengembalikan a`nextToken`. Anda dapat menggunakan nilai ini dalam `ListDataSources` permintaan lain untuk melihat kumpulan hasil berikutnya.

Untuk mendapatkan informasi peristiwa sinkronisasi untuk sumber data, kirim [GetIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html)permintaan dengan titik akhir waktu [build Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Tentukan`dataSourceId`,`knowledgeBaseId`, dan`ingestionJobId`.

Untuk mencantumkan riwayat sinkronisasi sumber data di basis pengetahuan, kirim [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Tentukan ID basis pengetahuan dan sumber data. Anda dapat mengatur spesifikasi berikut.
+ Filter untuk hasil dengan menentukan status untuk mencari di `filters` objek.
+ Urutkan berdasarkan waktu pekerjaan dimulai atau status pekerjaan dengan menentukan `sortBy` objek. Anda dapat mengurutkan dalam urutan naik atau turun.
+ Mengatur jumlah maksimum hasil untuk kembali dalam respon di `maxResults` lapangan. Jika ada lebih banyak hasil daripada nomor yang Anda tetapkan, respons akan mengembalikan permintaan `nextToken` yang dapat Anda kirim dalam [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html)permintaan lain untuk melihat kumpulan pekerjaan berikutnya.

------

# Ubah sumber data untuk basis pengetahuan Amazon Bedrock Anda
<a name="kb-ds-update"></a>

Anda dapat memperbarui sumber data untuk basis pengetahuan Anda, seperti mengubah konfigurasi sumber data.

Anda dapat memperbarui sumber data dengan cara berikut:
+ Tambahkan, ubah, atau hapus file atau konten dari sumber data.
+ Ubah konfigurasi sumber data, atau kunci KMS yang akan digunakan untuk mengenkripsi data sementara selama konsumsi data. Jika Anda mengubah detail konfigurasi sumber atau titik akhir, Anda harus memperbarui atau membuat peran IAM baru dengan izin akses yang diperlukan dan rahasia Secrets Manager (jika ada).
+ Tetapkan kebijakan penghapusan sumber data Anda ke “Hapus” atau “Pertahankan”. Anda dapat menghapus semua data dari sumber data Anda yang diubah menjadi embeddings vektor setelah penghapusan basis pengetahuan atau sumber daya sumber data. Anda dapat menyimpan semua data dari sumber data Anda yang diubah menjadi embeddings vektor setelah penghapusan basis pengetahuan atau sumber daya sumber data. Perhatikan bahwa **penyimpanan vektor itu sendiri tidak dihapus** jika Anda menghapus basis pengetahuan atau sumber daya sumber data.

Setiap kali Anda menambahkan, memodifikasi, atau menghapus file dari sumber data Anda, Anda harus menyinkronkan sumber data sehingga diindeks ulang ke basis pengetahuan. Sinkronisasi bersifat bertahap, jadi Amazon Bedrock hanya memproses dokumen yang ditambahkan, dimodifikasi, atau dihapus sejak sinkronisasi terakhir. Sebelum Anda mulai menelan, periksa apakah sumber data Anda memenuhi kondisi berikut:
+ File dalam format yang didukung. Untuk informasi selengkapnya, lihat [Format dokumen Dukungan](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html#kb-ds-supported-doc-formats-limits).
+ File tidak melebihi **ukuran file pekerjaan Ingestion** yang ditentukan di [titik akhir Amazon Bedrock dan](https://docs.aws.amazon.com/general/latest/gr/bedrock.html) kuota di. Referensi Umum AWS
+ Jika sumber data Anda berisi file metadata, periksa kondisi berikut untuk memastikan bahwa file metadata tidak diabaikan:
  + Setiap `.metadata.json` file berbagi nama file dan ekstensi yang sama dengan file sumber yang terkait dengannya.
  + Jika indeks vektor untuk basis pengetahuan Anda ada di penyimpanan vektor Amazon OpenSearch Tanpa Server, periksa apakah indeks vektor dikonfigurasi dengan mesin. `faiss` Jika indeks vektor dikonfigurasi dengan `nmslib` mesin, Anda harus melakukan salah satu hal berikut:
    + [Buat basis pengetahuan baru](knowledge-base-create.md) di konsol dan biarkan Amazon Bedrock secara otomatis membuat indeks vektor di Amazon OpenSearch Tanpa Server untuk Anda.
    + [Buat indeks vektor lain](knowledge-base-setup.md) di toko vektor dan pilih `faiss` sebagai **Mesin**. Kemudian [buat basis pengetahuan baru](knowledge-base-create.md) dan tentukan indeks vektor baru.
  + Jika indeks vektor untuk basis pengetahuan Anda berada di kluster database Amazon Aurora, sebaiknya gunakan bidang metadata khusus untuk menyimpan semua metadata Anda dalam satu kolom dan membuat indeks di kolom ini. Jika Anda tidak menyediakan bidang metadata kustom, Anda harus memeriksa bahwa tabel untuk indeks Anda berisi kolom untuk setiap properti metadata dalam file metadata Anda sebelum memulai konsumsi. Untuk informasi selengkapnya, lihat [Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan](knowledge-base-setup.md).

Untuk mempelajari cara memperbarui sumber data, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk memperbarui sumber data**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Pilih nama basis pengetahuan Anda.

1. Di bagian **Sumber data**, pilih tombol radio di sebelah sumber data yang ingin Anda edit dan sinkronkan.

1. (Opsional) Pilih **Edit**, ubah konfigurasi Anda, dan pilih **Kirim**. Jika Anda mengubah detail konfigurasi sumber atau titik akhir, Anda harus memperbarui atau membuat peran IAM baru dengan izin akses yang diperlukan dan rahasia Secrets Manager (jika ada). Juga, perhatikan bahwa tidak dapat mengubah konfigurasi chunking yang didasarkan pada data asli yang dicerna. Anda harus membuat ulang sumber data.
**catatan**  
Anda tidak dapat mengubah konfigurasi chunking. Anda harus membuat ulang sumber data.

1. (Opsional) Pilih untuk mengedit kebijakan penghapusan data sumber data Anda sebagai bagian dari pengaturan lanjutan:

   Untuk setelan kebijakan penghapusan data, Anda dapat memilih:
   + Hapus: Menghapus semua data dari sumber data Anda yang diubah menjadi embeddings vektor setelah penghapusan basis pengetahuan atau sumber daya sumber data. Perhatikan bahwa **penyimpanan vektor itu sendiri tidak dihapus**, hanya data. Bendera ini diabaikan jika AWS akun dihapus.
   + Mempertahankan: Menyimpan semua data dari sumber data Anda yang diubah menjadi embeddings vektor setelah penghapusan basis pengetahuan atau sumber daya sumber data. Perhatikan bahwa **penyimpanan vektor itu sendiri tidak dihapus** jika Anda menghapus basis pengetahuan atau sumber daya sumber data.

1. Pilih **Sinkronisasi**.

1. Spanduk hijau muncul saat sinkronisasi selesai dan **Status** menjadi **Siap**.

------
#### [ API ]

**Untuk memperbarui sumber data**

1. (Opsional) Kirim [UpdateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_UpdateDataSource.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt), ubah konfigurasi apa pun, dan tentukan konfigurasi yang sama yang tidak ingin Anda ubah. Jika Anda mengubah detail konfigurasi sumber atau titik akhir, Anda harus memperbarui atau membuat peran IAM baru dengan izin akses yang diperlukan dan rahasia Secrets Manager (jika ada).
**catatan**  
Anda tidak dapat mengubah`chunkingConfiguration`. Kirim permintaan dengan yang ada`chunkingConfiguration`, atau buat ulang sumber data.

1. (Opsional) `dataDeletionPolicy` Ubah sumber data Anda. Anda dapat `DELETE` semua data dari sumber data Anda yang diubah menjadi embeddings vektor setelah penghapusan basis pengetahuan atau sumber daya sumber data. Bendera ini diabaikan jika AWS akun dihapus. Anda dapat `RETAIN` semua data dari sumber data Anda yang diubah menjadi embeddings vektor setelah penghapusan basis pengetahuan atau sumber daya sumber data. Perhatikan bahwa **penyimpanan vektor itu sendiri tidak dihapus** jika Anda menghapus basis pengetahuan atau sumber daya sumber data.

1. Kirim [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt), dengan menentukan dan. `dataSourceId` `knowledgeBaseId`

------

# Menghapus sumber data dari basis pengetahuan Amazon Bedrock Anda
<a name="kb-ds-delete"></a>

Anda dapat menghapus atau menghapus sumber data yang tidak lagi Anda perlukan atau gunakan untuk basis pengetahuan Anda.

Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk menghapus sumber data**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Sumber data**, pilih tombol radio di sebelah sumber data yang ingin Anda hapus.

1. Pilih **Hapus**.

1. Spanduk hijau muncul ketika sumber data berhasil dihapus.
**catatan**  
Kebijakan penghapusan data untuk sumber data disetel ke “Hapus” (menghapus semua data saat Anda menghapus sumber data, tetapi **tidak menghapus penyimpanan vektor itu sendiri) atau “Pertahankan**” (menyimpan semua data saat Anda menghapus sumber data). Jika Anda menghapus sumber data atau basis pengetahuan, **penyimpanan vektor itu sendiri tidak dihapus**. Jika kebijakan penghapusan data sumber data disetel ke “Hapus”, sumber data mungkin tidak berhasil menyelesaikan proses penghapusan karena masalah dengan konfigurasi atau akses ke penyimpanan vektor. Anda dapat memeriksa status “DELETE\$1UNSUCCESSFUCCESS” untuk melihat alasan mengapa sumber data tidak berhasil dihapus.

------
#### [ API ]

Untuk menghapus sumber data dari basis pengetahuan, kirim [DeleteDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DeletDataSource.html)permintaan, tentukan `dataSourceId` dan`knowledgeBaseId`.

**catatan**  
Kebijakan penghapusan data untuk sumber data disetel ke salah satu `DELETE` (menghapus semua data saat Anda menghapus sumber data, tetapi **tidak menghapus penyimpanan vektor itu sendiri) atau `RETAIN` (menyimpan** semua data saat Anda menghapus sumber data). Jika Anda menghapus sumber data atau basis pengetahuan, **penyimpanan vektor itu sendiri tidak dihapus**. Jika kebijakan penghapusan data sumber data disetel ke`DELETE`, sumber data mungkin tidak berhasil menyelesaikan proses penghapusan karena masalah dengan konfigurasi atau akses ke penyimpanan vektor. Anda dapat melihat `failureReasons` apakah status sumber data adalah `DELETE_UNSUCCESSFUL` untuk melihat alasan mengapa sumber data tidak berhasil dihapus.

------

# Membangun basis pengetahuan untuk konten multimodal
<a name="kb-multimodal"></a>

Amazon Bedrock Knowledge Bases mendukung konten multimodal termasuk gambar, audio, dan file video. Anda dapat mencari menggunakan gambar sebagai kueri, mengambil konten yang mirip secara visual, dan memproses file multimedia bersama dokumen teks tradisional. Kemampuan ini memungkinkan Anda mengekstrak wawasan dari beragam tipe data—gambar mandiri, rekaman audio, dan file video yang disimpan di seluruh organisasi Anda.

Amazon Bedrock Knowledge Bases memungkinkan Anda untuk mengindeks dan mengambil informasi dari teks, visual, dan konten audio. Organizations sekarang dapat mencari katalog produk menggunakan gambar, menemukan momen tertentu dalam video pelatihan, dan mengambil segmen yang relevan dari rekaman panggilan dukungan pelanggan.

**Ketersediaan wilayah**  
Pendekatan pemrosesan multimodal memiliki ketersediaan regional yang berbeda. Untuk detail informasi, lihat [Ketersediaan wilayah](kb-multimodal-choose-approach.md#kb-multimodal-processing-regions).

## Fitur dan kemampuan
<a name="kb-multimodal-features"></a>

Basis pengetahuan multimodal memberikan kemampuan kunci berikut:

**Kueri berbasis gambar**  
Kirim gambar sebagai permintaan pencarian untuk menemukan konten yang mirip secara visual saat menggunakan Nova Multimodal Embeddings. Mendukung pencocokan produk, pencarian kesamaan visual, dan pengambilan gambar.

**Pengambilan konten audio**  
Cari file audio menggunakan kueri teks. Ambil segmen tertentu dari rekaman dengan referensi stempel waktu. Transkripsi audio memungkinkan pencarian berbasis teks di seluruh konten lisan termasuk rapat, panggilan, dan podcast.

**Ekstraksi segmen video**  
Temukan momen tertentu dalam file video menggunakan kueri teks. Ambil segmen video dengan stempel waktu yang tepat.

**Pencarian lintas-modal**  
Cari di berbagai jenis data termasuk dokumen teks, gambar, audio, dan video. Ambil konten yang relevan terlepas dari format aslinya.

**Referensi sumber dengan stempel waktu**  
Hasil pengambilan termasuk referensi ke file asli dengan metadata temporal untuk audio dan video. Memungkinkan navigasi yang tepat ke segmen yang relevan dalam konten multimedia.

**Opsi pemrosesan yang fleksibel**  
Pilih antara penyematan multimodal asli untuk kesamaan visual atau konversi teks untuk konten berbasis ucapan. Konfigurasikan pendekatan pemrosesan berdasarkan karakteristik konten dan persyaratan aplikasi.

## Cara kerjanya
<a name="kb-multimodal-how-it-works"></a>

Basis pengetahuan multimodal memproses dan mengambil konten melalui pipeline multi-tahap yang menangani berbagai tipe data dengan tepat:

****Tertelan dan pemrosesan****

1. **Koneksi sumber data:** Hubungkan basis pengetahuan Anda ke bucket Amazon S3 atau sumber data khusus yang berisi dokumen teks, gambar, file audio, dan file video.

1. **Deteksi jenis file:** Sistem mengidentifikasi setiap jenis file dengan ekstensi dan mengarahkannya ke pipa pemrosesan yang sesuai.

1. **Pemrosesan konten:** Bergantung pada konfigurasi Anda, file diproses menggunakan salah satu dari dua pendekatan:
   + **Nova Multimodal Embeddings:** Mempertahankan format asli untuk pencocokan kesamaan visual dan audio. Gambar, audio, dan video disematkan secara langsung tanpa konversi ke teks.
   + **Otomasi Data Batuan Dasar (BDA):** Mengonversi multimedia menjadi representasi teks. Audio ditranskripsikan menggunakan Automatic Speech Recognition (ASR), video diproses untuk mengekstrak ringkasan adegan dan transkrip, dan gambar menjalani OCR dan ekstraksi konten visual.

1. **Pembuatan penyematan:** Konten yang diproses diubah menjadi penyematan vektor menggunakan model penyematan yang Anda pilih. Embeddings ini menangkap makna semantik dan memungkinkan pengambilan berbasis kesamaan.

1. **Penyimpanan vektor:** Embeddings disimpan dalam database vektor yang dikonfigurasi bersama dengan metadata termasuk referensi file, stempel waktu (untuk audio dan video), dan informasi jenis konten.

1. **Penyimpanan multimodal (opsional):** Jika dikonfigurasi, file multimedia asli disalin ke tujuan penyimpanan multimodal khusus untuk pengambilan yang andal, memastikan ketersediaan bahkan jika file sumber dimodifikasi atau dihapus.

****Kueri dan pengambilan****

1. **Pemrosesan kueri:** Kueri pengguna (teks atau gambar) diubah menjadi penyematan menggunakan model penyematan yang sama yang digunakan selama konsumsi.

1. **Pencarian kesamaan:** Penyematan kueri dibandingkan dengan penyematan yang disimpan dalam database vektor untuk mengidentifikasi konten yang paling relevan.

1. **Pengambilan hasil:** Sistem mengembalikan konten yang cocok dengan metadata termasuk:
   + URI Sumber (lokasi file asli)
   + Metadata stempel waktu (untuk segmen audio dan video)
   + Jenis konten dan informasi modalitas

1. **Pembuatan respons (opsional):** Untuk `RetrieveAndGenerate` permintaan, konten yang diambil diteruskan ke model dasar untuk menghasilkan respons teks yang relevan secara kontekstual. Ini didukung saat menggunakan pemrosesan BDA atau ketika basis pengetahuan berisi konten teks.

**penting**  
Sistem mengembalikan referensi untuk melengkapi file dengan metadata stempel waktu untuk konten audio dan video. Aplikasi Anda harus mengekstrak dan memainkan segmen tertentu berdasarkan stempel waktu awal dan akhir yang disediakan. Konsol Manajemen AWS Menangani ini secara otomatis.

**Topics**
+ [Fitur dan kemampuan](#kb-multimodal-features)
+ [Cara kerjanya](#kb-multimodal-how-it-works)
+ [Memilih pendekatan pemrosesan multimodal Anda](kb-multimodal-choose-approach.md)
+ [Prasyarat untuk basis pengetahuan multimodal](kb-multimodal-prerequisites.md)
+ [Buat basis pengetahuan untuk konten multimodal](kb-multimodal-create.md)
+ [Menambahkan sumber data dan memulai konsumsi](kb-multimodal-add-data-source-and-ingest.md)
+ [Menguji dan menanyakan basis pengetahuan multimodal](kb-multimodal-test-and-query.md)
+ [Memecahkan masalah basis pengetahuan multimodal](kb-multimodal-troubleshooting.md)

# Memilih pendekatan pemrosesan multimodal Anda
<a name="kb-multimodal-choose-approach"></a>

Amazon Bedrock Knowledge Bases menawarkan dua pendekatan untuk memproses konten multimodal: Nova Multimodal Embeddings untuk pencarian kesamaan visual, dan Bedrock Data Automation (BDA) untuk pemrosesan konten multimedia berbasis teks. Anda juga dapat menggunakan model foundation sebagai parser Anda jika modalitas input Anda adalah gambar tetapi tidak untuk audio atau video.

Bagian ini menjelaskan penggunaan Nova Multimodal Embeddings dan BDA sebagai pendekatan pemrosesan Anda untuk konten multimodal. Setiap pendekatan dioptimalkan untuk kasus penggunaan dan pola kueri yang berbeda.

**Topics**
+ [Pendekatan pemrosesan multimodal](#kb-multimodal-processing-approach)
+ [Ketersediaan wilayah](#kb-multimodal-processing-regions)
+ [Kriteria pemilihan berdasarkan jenis konten](#kb-multimodal-selection-guidance)
+ [Jenis file dan sumber data yang didukung](#kb-multimodal-supported-files)
+ [Kemampuan dan keterbatasan](#kb-multimodal-approach-details)

## Pendekatan pemrosesan multimodal
<a name="kb-multimodal-processing-approach"></a>

Tabel berikut menunjukkan perbandingan antara Nova Multimodal Embeddings dan BDA untuk memproses konten multimodal.


**Perbandingan pendekatan pemrosesan**  

| Karakteristik | Embeddings Multimodal Nova | Otomasi Data Batuan Dasar (BDA) | 
| --- | --- | --- | 
| Metode pengolahan | Menghasilkan embeddings tanpa konversi teks menengah | Mengonversi multimedia menjadi teks, lalu membuat embeddings | 
| Jenis kueri didukung | Kueri teks atau kueri gambar | Hanya kueri teks | 
| Kasus penggunaan primer | Pencarian kesamaan visual, pencocokan produk, penemuan gambar | Transkripsi ucapan, pencarian berbasis teks, analisis konten | 
| Fungsionalitas RAG | Terbatas hanya untuk konten teks | RetrieveAndGenerateDukungan penuh | 
| Persyaratan penyimpanan | Diperlukan tujuan penyimpanan multimodal | Tujuan penyimpanan multimodal opsional meskipun jika tidak ditentukan, hanya data teks yang akan diproses oleh BDA. Untuk input non-teks, Anda harus menentukan tujuan penyimpanan multimodal. | 

## Ketersediaan wilayah
<a name="kb-multimodal-processing-regions"></a>


**Ketersediaan wilayah**  

| Embeddings Multimodal Nova | Otomasi Data Batuan Dasar (BDA) | 
| --- | --- | 
| Hanya US East (Virginia N.) |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/kb-multimodal-choose-approach.html)  | 

## Kriteria pemilihan berdasarkan jenis konten
<a name="kb-multimodal-selection-guidance"></a>

Gunakan matriks keputusan ini untuk memilih pendekatan pemrosesan yang sesuai berdasarkan konten Anda dan persyaratan kasus penggunaan:

**catatan**  
Jika Anda menggunakan parser BDA dengan model Amazon Nova Multimodal Embeddings, model embeddings akan bertindak seperti model penyematan teks. Saat bekerja dengan konten multimodal, gunakan salah satu pendekatan pemrosesan untuk hasil terbaik tergantung pada kasus penggunaan Anda.


**Memproses rekomendasi pendekatan berdasarkan jenis konten**  

| Jenis Konten | Embeddings Multimodal Nova | Otomasi Data Batuan Dasar (BDA) | 
| --- | --- | --- | 
| Katalog dan gambar produk | Direkomendasikan - Mengaktifkan pencocokan kesamaan visual dan kueri berbasis gambar | Terbatas - Hanya mengekstrak teks melalui OCR | 
| Rekaman rapat dan panggilan | Tidak dapat memproses konten ucapan secara bermakna | Direkomendasikan - Menyediakan transkripsi ucapan lengkap dan teks yang dapat dicari | 
| Video pelatihan dan pendidikan | Partial - Menangani konten visual tetapi melewatkan pidato | Direkomendasikan - Menangkap transkrip ucapan dan deskripsi visual | 
| Rekaman dukungan pelanggan | Tidak direkomendasikan - Konten ucapan tidak dapat diproses secara efektif | Direkomendasikan - Membuat transkrip percakapan lengkap yang dapat dicari | 
| Diagram dan grafik teknis | Direkomendasikan - Sangat baik untuk kesamaan visual dan pencocokan pola | Terbatas - Mengekstrak label teks tetapi melewatkan hubungan visual | 

## Jenis file dan sumber data yang didukung
<a name="kb-multimodal-supported-files"></a>

Jenis file yang didukung bergantung pada pendekatan pemrosesan yang Anda pilih:


**Jenis file yang didukung dengan pendekatan pemrosesan**  

| Jenis File | Embeddings Multimodal Nova | Otomasi Data Batuan Dasar (BDA) | 
| --- | --- | --- | 
| Citra | .png, .jpg, .jpeg, .gif, .webp | .png, .jpg, .jpeg | 
| Audio | .mp3, .ogg, .wav | .amr, .flac, .m4a, .mp3, .ogg, .wav | 
| Video | .mp4, .mov, .mkv, .webm, .flv, .mpeg, .mpg, .wmv, .3gp | .mp4, .mov | 
| Dokumen | Diproses sebagai teks | .pdf (ditambah ekstraksi teks dari gambar) | 

****Sumber data yang didukung****  
Konten multimodal didukung dengan sumber data berikut:
+ **Amazon S3:** Dukungan penuh untuk semua jenis file multimodal
+ **Sumber data khusus:** Support untuk konten inline hingga 10MB base64 dikodekan

**penting**  
Pengambilan multimodal saat ini hanya tersedia untuk sumber data Amazon S3. Sumber data lain (Confluence,, Salesforce SharePoint, Web Crawler) tidak memproses file multimodal selama konsumsi. File-file ini dilewati dan tidak akan tersedia untuk kueri multimodal.

## Kemampuan dan keterbatasan
<a name="kb-multimodal-approach-details"></a>

**Embeddings Multimodal Nova**  
**Kemampuan kunci:**  
+ Pemrosesan multimodal asli mempertahankan format konten asli untuk pencocokan kesamaan visual yang optimal
+ Kueri berbasis gambar memungkinkan pengguna untuk mengunggah gambar dan menemukan konten yang mirip secara visual
+ Kinerja luar biasa untuk katalog produk, pencarian visual, dan aplikasi penemuan konten
**Keterbatasan:**  
+ Tidak dapat memproses konten ucapan atau audio secara efektif - informasi yang diucapkan tidak dapat dicari
+ `RetrieveAndGenerate`dan fungsionalitas rerank terbatas pada konten teks saja
+ Memerlukan konfigurasi tujuan penyimpanan multimodal khusus

**Otomasi Data Batuan Dasar (BDA)**  
**Kemampuan kunci:**  
+ Transkripsi ucapan komprehensif menggunakan teknologi Automatic Speech Recognition (ASR)
+ Analisis konten visual menghasilkan teks deskriptif untuk gambar dan adegan video
+ `RetrieveAndGenerate`Dukungan penuh memungkinkan fungsionalitas RAG lengkap di semua konten
+ Pencarian berbasis teks bekerja secara konsisten di semua jenis konten multimedia
**Keterbatasan:**  
+ Tidak ada dukungan untuk kueri berbasis gambar saat digunakan tanpa Nova Multimodal Embeddings - semua pencarian harus menggunakan input teks
+ Tidak dapat melakukan pencocokan kesamaan visual atau image-to-image pencarian
+ Waktu pemrosesan konsumsi yang lebih lama karena persyaratan konversi konten
+ Mendukung lebih sedikit format file multimedia dibandingkan dengan Nova Multimodal Embeddings

**Pemrosesan konten ucapan**  
Nova Multimodal Embeddings tidak dapat secara efektif memproses konten ucapan dalam file audio atau video. Jika konten multimedia Anda berisi informasi lisan penting yang perlu dicari pengguna, pilih pendekatan BDA untuk memastikan transkripsi dan kemampuan pencarian penuh.

# Prasyarat untuk basis pengetahuan multimodal
<a name="kb-multimodal-prerequisites"></a>

Basis pengetahuan multimodal Amazon Bedrock memerlukan penyiapan tambahan di luar basis pengetahuan standar untuk memproses konten gambar, audio, dan video. Prasyarat spesifik tergantung pada pendekatan pemrosesan dan konfigurasi penyimpanan yang Anda pilih.

Sebelum Anda dapat membuat basis pengetahuan multimodal, Anda harus memenuhi prasyarat berikut:

**Topics**
+ [Prasyarat](#kb-multimodal-prerequisites)
+ [Izin untuk konten multimodal](#kb-multimodal-prerequisites-permissions)

## Prasyarat
<a name="kb-multimodal-prerequisites"></a>

1. Pastikan data Anda berada di [konektor sumber data yang didukung](data-source-connectors.md). Konten multimodal hanya didukung dengan Amazon S3 dan sumber data khusus.

1. (Opsional) [Siapkan penyimpanan vektor Anda sendiri yang didukung](knowledge-base-setup.md). Anda dapat melewati langkah ini jika Anda berencana untuk menggunakan Konsol Manajemen AWS untuk secara otomatis membuat penyimpanan vektor untuk Anda.

1. Buat [peran layanan](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_terms-and-concepts.html#iam-term-service-role) kustom AWS Identity and Access Management (IAM) dengan izin yang tepat untuk pemrosesan multimodal. Lihat [Izin untuk konten multimodal](#kb-multimodal-prerequisites-permissions) untuk detail.
**catatan**  
Jika Anda menggunakan konsol, Pangkalan Pengetahuan Amazon Bedrock akan secara otomatis mengonfigurasi izin untuk Anda.

1. (Opsional) Siapkan konfigurasi keamanan ekstra dengan mengikuti langkah-langkah di[Enkripsi sumber daya basis pengetahuan](encryption-kb.md).

1. Jika Anda berencana untuk menggunakan operasi [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)API dengan konten yang diproses BDA, minta akses ke model yang akan Anda gunakan di Wilayah tempat Anda akan menggunakannya dengan mengikuti langkah-langkah di. [Akses model fondasi Amazon Bedrock](model-access.md)

## Izin untuk konten multimodal
<a name="kb-multimodal-prerequisites-permissions"></a>

Basis pengetahuan multimodal memerlukan izin tambahan di luar izin basis pengetahuan standar. Izin spesifik bergantung pada pendekatan pemrosesan dan konfigurasi penyimpanan yang Anda pilih.

Anda harus mengonfigurasi izin berikut berdasarkan pendekatan pemrosesan multimodal Anda:
+ **Izin Nova Multimodal Embeddings:** Diperlukan saat menggunakan Nova Multimodal Embeddings untuk pencarian kesamaan visual dan audio langsung. Termasuk izin untuk pemanggilan model asinkron dan akses penyimpanan multimodal.
+ **Izin Otomasi Data Batuan Dasar (BDA):** Diperlukan saat menggunakan BDA untuk mengonversi konten multimodal menjadi representasi teks. Termasuk izin untuk pemanggilan otomatisasi data dan pemantauan status.
+ **Izin kunci KMS yang dikelola pelanggan: Diperlukan saat menggunakan kunci** enkripsi yang dikelola pelanggan dengan pemrosesan BDA. Termasuk izin untuk operasi utama dan pembuatan hibah.
+ **Izin penyimpanan multimodal:** Diperlukan saat mengonfigurasi tujuan penyimpanan multimodal. Termasuk izin S3 standar untuk ember penyimpanan.

Untuk detail kebijakan IAM dan konfigurasi step-by-step izin, lihat[Izin untuk konten multimodal](kb-permissions.md#kb-permissions-multimodal).

### Persyaratan penyimpanan
<a name="kb-multimodal-storage-requirements"></a>

**Penyematan Multimodal Nova**  
**Wajib:** Anda harus mengonfigurasi tujuan penyimpanan multimodal. Tujuan ini menyimpan salinan file multimedia Anda untuk pengambilan dan memastikan ketersediaan bahkan jika file sumber dimodifikasi atau dihapus.

**Otomasi Data Batuan Dasar (BDA)**  
**Opsional:** Anda dapat mengonfigurasi bucket penyimpanan multimodal untuk keandalan tambahan, dan juga untuk mengambil file saat runtime. Namun, itu tidak diperlukan karena BDA mengonversi konten menjadi teks.  
Jika Anda memilih parser BDA tanpa mengonfigurasi bucket penyimpanan multimodal, hanya penguraian teks yang akan tersedia. Untuk memanfaatkan kemampuan parsing multimodal dengan BDA (memproses gambar, audio, dan video), Anda harus mengonfigurasi tujuan penyimpanan multimodal.

**Konfigurasi tujuan penyimpanan multimodal**  
Saat mengonfigurasi tujuan penyimpanan multimodal Anda, pertimbangkan hal berikut:
+ **Gunakan bucket terpisah (disarankan):** Konfigurasikan bucket Amazon S3 yang berbeda untuk sumber data dan tujuan penyimpanan multimodal Anda. Ini menyediakan pengaturan paling sederhana dan menghindari potensi konflik.
+ **Jika menggunakan bucket yang sama:** Anda harus menentukan awalan inklusi untuk sumber data yang membatasi konten mana yang tertelan. Ini mencegah pengambilan ulang file media yang diekstraksi.
+ **Hindari awalan “aws/”:** Saat menggunakan bucket yang sama untuk sumber data dan tujuan penyimpanan multimodal, jangan gunakan awalan inklusi yang dimulai dengan “aws/” karena jalur ini dicadangkan untuk penyimpanan media yang diekstraksi.

# Buat basis pengetahuan untuk konten multimodal
<a name="kb-multimodal-create"></a>

Anda dapat membuat basis pengetahuan multimodal menggunakan konsol atau API. Pilih pendekatan Anda berdasarkan kebutuhan pemrosesan multimodal Anda.

**penting**  
Dukungan multimodal hanya tersedia saat membuat basis pengetahuan dengan sumber data yang tidak terstruktur. Sumber data terstruktur tidak mendukung pemrosesan konten multimodal.

------
#### [ Console ]

**Untuk membuat basis pengetahuan multimodal dari konsol**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, pilih **Buat**, lalu pilih **Pangkalan Pengetahuan dengan penyimpanan vektor**.

1. (Opsional) Di bawah **detail Basis Pengetahuan**, ubah nama default dan berikan deskripsi untuk basis pengetahuan Anda.

1. Di bawah **izin IAM**, pilih peran IAM yang menyediakan izin Amazon Bedrock untuk mengakses lainnya yang diperlukan. Layanan AWS Anda dapat meminta Amazon Bedrock membuat peran layanan untuk Anda, atau Anda dapat memilih untuk menggunakan peran kustom Anda sendiri. Untuk izin multimodal, lihat. [Izin untuk konten multimodal](kb-permissions.md#kb-permissions-multimodal)

1. Pilih **Amazon S3** sebagai sumber data Anda dan pilih **Berikutnya** untuk mengonfigurasi sumber data Anda.
**catatan**  
Anda dapat menambahkan hingga 5 sumber data Amazon S3 selama pembuatan basis pengetahuan. Sumber data tambahan dapat ditambahkan setelah basis pengetahuan dibuat.

1. Berikan **URI S3** bucket yang berisi konten multimodal Anda dan konfigurasikan awalan inklusi jika diperlukan. Awalan inklusi adalah jalur folder yang dapat digunakan untuk membatasi konten apa yang dicerna.

1. Di bawah **konfigurasi Chunking dan parsing**, pilih strategi parsing Anda:
   + **Pengurai default batuan dasar:** Direkomendasikan untuk pemrosesan konten khusus teks. Parser ini memproses format teks umum sambil mengabaikan file multimodal. Mendukung dokumen teks termasuk file Word, Excel, HTML, Markdown, TXT, dan CSV.
   + **Otomasi Data Batuan Dasar (BDA):** Mengonversi konten multimodal menjadi representasi teks yang dapat dicari. Memproses PDFs, gambar, audio, dan file video untuk mengekstrak teks, menghasilkan deskripsi untuk konten visual, dan membuat transkripsi untuk konten audio dan video.
   + **Foundation model parser:** Menyediakan kemampuan parsing canggih untuk struktur dokumen yang kompleks. Proses PDFs, gambar, dokumen terstruktur, tabel, dan konten yang kaya secara visual untuk mengekstrak teks dan menghasilkan deskripsi untuk elemen visual.

1. Pilih **Berikutnya** dan pilih model embedding dan pendekatan pemrosesan multimodal Anda. 
   + **Amazon Nova Multimodal Embeddings V1.0:** Pilih **Amazon Nova embedding** V1.0 untuk pencarian kesamaan visual dan audio langsung. Konfigurasikan durasi potongan audio dan video (1-30 detik, default 5 detik) untuk mengontrol bagaimana konten tersegmentasi.
**catatan**  
Parameter chunking audio dan video dikonfigurasi pada tingkat model penyematan, bukan pada tingkat sumber data. Pengecualian validasi terjadi jika Anda menyediakan konfigurasi ini untuk model penyematan non-multimodal. Konfigurasikan durasi potongan audio dan video (default: 5 detik, rentang: 1-30 detik) untuk mengontrol bagaimana konten tersegmentasi. Potongan yang lebih pendek memungkinkan pengambilan konten yang tepat sementara potongan yang lebih panjang mempertahankan lebih banyak konteks semantik.
**penting**  
Amazon Nova embedding v1.0 memiliki dukungan terbatas untuk mencari konten ucapan dalam audio/video data. Jika Anda perlu mendukung pidato, gunakan Otomasi Data Batuan Dasar sebagai parser.
   + **Penyematan teks dengan BDA: Pilih model penyematan teks (seperti Titan Text Embeddings** v2) saat menggunakan pemrosesan BDA. Model penyematan teks membatasi pengambilan ke konten khusus teks, tetapi Anda dapat mengaktifkan pengambilan multimodal dengan memilih Amazon Bedrock Data Automation atau Foundation Model sebagai parser.
**catatan**  
Jika Anda menggunakan parser BDA dengan Nova Multimodal Embeddings, Amazon Bedrock Knowledge Bases akan menggunakan penguraian BDA terlebih dahulu. Dalam hal ini, model penyematan tidak akan menghasilkan penyematan multimodal asli untuk gambar, audio, dan video karena BDA mengonversinya menjadi representasi teks.

1. Jika menggunakan Nova Multimodal Embeddings, konfigurasikan **tujuan penyimpanan Multimodal** dengan menentukan bucket Amazon S3 tempat file yang diproses akan disimpan untuk diambil. Knowledge Bases akan menyimpan gambar yang diuraikan ke dalam satu bucket Amazon S3 dengan folder yang dibuat.bda untuk memudahkan akses.
**Rekomendasi kebijakan siklus hidup**  
Saat menggunakan Nova Multimodal Embeddings, Amazon Bedrock menyimpan data sementara di tujuan penyimpanan multimodal Anda dan mencoba menghapusnya setelah pemrosesan selesai. Sebaiknya terapkan kebijakan siklus hidup pada jalur data transien untuk memastikan pembersihan yang tepat. Untuk petunjuk mendetail, lihat [Mengelola data sementara dengan kebijakan siklus hidup Amazon S3](kb-multimodal-troubleshooting.md#kb-multimodal-lifecycle-policy).

1. Di bagian **Basis data vektor**, pilih metode penyimpanan vektor Anda dan konfigurasikan dimensi yang sesuai berdasarkan model penyematan yang Anda pilih.

1. Pilih **Berikutnya** dan tinjau detail konfigurasi basis pengetahuan Anda, lalu pilih **Buat basis pengetahuan**.

------
#### [ CLI ]

**Untuk membuat basis pengetahuan multimodal menggunakan AWS CLI**
+ Buat basis pengetahuan dengan Nova Multimodal Embeddings. Kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html)permintaan:

  ```
  aws bedrock-agent create-knowledge-base \
  --cli-input-json file://kb-nova-mme.json
  ```

  Isi `kb-nova-mme.json` (ganti nilai placeholder dengan konfigurasi spesifik Anda):

  ```
  {
      "knowledgeBaseConfiguration": {
          "vectorKnowledgeBaseConfiguration": {
              "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.nova-2-multimodal-embeddings-v1:0",
              "supplementalDataStorageConfiguration": {
                  "storageLocations": [
                      {
                          "type": "S3",
                          "s3Location": {
                              "uri": "s3://<multimodal-storage-bucket>/"
                          }
                      }
                  ]
              }
          },
          "type": "VECTOR"
      },
      "storageConfiguration": {
          "opensearchServerlessConfiguration": {
              "collectionArn": "arn:aws:aoss:us-east-1:<account-id>:collection/<collection-id>",
              "vectorIndexName": "<index-name>",
              "fieldMapping": {
                  "vectorField": "<vector-field>",
                  "textField": "<text-field>",
                  "metadataField": "<metadata-field>"
              }
          },
          "type": "OPENSEARCH_SERVERLESS"
      },
      "name": "<knowledge-base-name>",
      "description": "Multimodal knowledge base with Nova Multimodal Embeddings"
  }
  ```

  Ganti placeholder berikut:
  + `<multimodal-storage-bucket>`- Bucket S3 untuk menyimpan file multimodal
  + `<account-id>`- ID akun AWS Anda
  + `<collection-id>`- OpenSearch ID koleksi tanpa server
  + `<index-name>`- Nama indeks vektor dalam OpenSearch koleksi Anda (dikonfigurasi dengan dimensi yang sesuai untuk model penyematan pilihan Anda)
  + `<vector-field>`- Nama bidang untuk menyimpan embeddings
  + `<text-field>`- Nama bidang untuk menyimpan konten teks
  + `<metadata-field>`- Nama bidang untuk menyimpan metadata

------

# Menambahkan sumber data dan memulai konsumsi
<a name="kb-multimodal-add-data-source-and-ingest"></a>

Setelah membuat basis pengetahuan Anda, tambahkan sumber data yang berisi konten multimodal Anda dan mulailah pekerjaan konsumsi untuk memproses dan mengindeks konten.

**Perilaku penghapusan sumber data**  
Saat Anda menghapus sumber data dengan kebijakan penghapusan yang disetel ke RESTAIN, konten yang dicerna tetap berada dalam database vektor dan akan terus digunakan untuk pengambilan. Konten hanya dihapus jika Anda secara eksplisit menyinkronkan basis pengetahuan setelah menghapus sumber data. Sumber data dengan kebijakan DELETE default akan secara otomatis menghapus konten dari database vektor dan penyimpanan tambahan selama penghapusan. Ini memastikan bahwa basis pengetahuan Anda terus berfungsi meskipun file sumber dimodifikasi atau dihapus, tetapi Anda harus menyadari bahwa sumber data yang dihapus dengan kebijakan RETAIN mungkin masih berkontribusi pada hasil pencarian.

## Tambahkan sumber data
<a name="kb-multimodal-add-data-source"></a>

Tambahkan sumber data yang berisi konten multimodal Anda ke basis pengetahuan Anda.

**penting**  
Untuk sumber data BDA: Hanya sumber data yang dibuat setelah peluncuran audio/video dukungan yang akan memproses file audio dan video. Sumber data BDA yang ada yang dibuat sebelum peluncuran fitur ini akan terus melewati file audio dan video. Untuk mengaktifkan audio/video pemrosesan basis pengetahuan yang ada, buat sumber data baru.

------
#### [ Console ]

**Untuk menambahkan sumber data dari konsol**

1. Dari halaman detail basis pengetahuan Anda, pilih **Tambahkan sumber data**.

1. Pilih **Amazon S3 sebagai tipe** sumber data Anda.

1. Berikan nama dan deskripsi untuk sumber data Anda.

1. Konfigurasikan lokasi Amazon S3 yang berisi file multimodal Anda dengan menyediakan URI bucket dan awalan inklusi apa pun.

1. Di bawah **Parsing dan chunking Konten**, konfigurasikan metode parsing dan chunking Anda:
**catatan**  
Model penyematan teks membatasi pengambilan ke konten khusus teks, tetapi Anda dapat mengaktifkan pengambilan multimodal melalui teks dengan memilih Amazon Bedrock Data Automation (untuk audio, video, dan gambar) atau Foundation Model sebagai parser (untuk gambar).

   Pilih dari tiga strategi parsing:
   + **Pengurai default batuan dasar: Direkomendasikan untuk penguraian** teks saja. Parser ini mengabaikan konten multimodal dan biasanya digunakan dengan model penyematan multimodal.
   + **Otomasi Data Batuan Dasar sebagai parser:** Memungkinkan penguraian dan penyimpanan konten multimodal sebagai file teks, pendukung, gambar PDFs, audio, dan video.
   + **Model dasar sebagai parser:** Menyediakan penguraian lanjutan untuk gambar dan dokumen terstruktur, pendukung, gambar PDFs, tabel, dan dokumen yang kaya secara visual.

1. Pilih **Tambahkan sumber data** untuk membuat sumber data.

------
#### [ CLI ]

**Untuk menambahkan sumber data menggunakan AWS CLI**
+ Buat sumber data untuk konten multimodal Anda. Kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)permintaan:

  ```
  aws bedrock-agent create-data-source \
  --knowledge-base-id <knowledge-base-id> \
  --cli-input-json file://ds-multimodal.json
  ```

  Untuk Nova Multimodal Embeddings (tidak perlu konfigurasi parsing khusus), gunakan konten ini: `ds-multimodal.json`

  ```
  {
      "dataSourceConfiguration": {
          "type": "S3",
          "s3Configuration": {
              "bucketArn": "arn:aws:s3:::<data-source-bucket>",
              "inclusionPrefixes": ["<folder-path>"]
          }
      },
      "name": "multimodal_data_source",
      "description": "Data source with multimodal content",
      "dataDeletionPolicy": "RETAIN"
  }
  ```

  Untuk pendekatan parsing BDA, gunakan konfigurasi ini:

  ```
  {
      "dataSourceConfiguration": {
          "type": "S3",
          "s3Configuration": {
              "bucketArn": "arn:aws:s3:::<data-source-bucket>",
              "inclusionPrefixes": ["<folder-path>"]
          }
      },
      "name": "multimodal_data_source_bda",
      "description": "Data source with BDA multimodal parsing",
      "dataDeletionPolicy": "RETAIN",
      "vectorIngestionConfiguration": {
          "parsingConfiguration": {
              "bedrockDataAutomationConfiguration": {
                  "parsingModality": "MULTIMODAL"
              }
          }
      }
  }
  ```

------

## Mulai pekerjaan menelan
<a name="kb-multimodal-start-ingestion"></a>

Setelah menambahkan sumber data Anda, mulailah pekerjaan konsumsi untuk memproses dan mengindeks konten multimodal Anda.

------
#### [ Console ]

**Untuk memulai konsumsi dari konsol**

1. Dari halaman detail sumber data Anda, pilih **Sinkronkan**.

1. Pantau status sinkronisasi pada halaman sumber data. Tertelan mungkin memakan waktu beberapa menit tergantung pada ukuran dan jumlah file multimodal Anda.

1. Setelah sinkronisasi berhasil diselesaikan, konten multimodal Anda siap untuk ditanyakan.

------
#### [ CLI ]

**Untuk memulai konsumsi menggunakan AWS CLI**

1. Mulai pekerjaan menelan. Kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)permintaan:

   ```
   aws bedrock-agent start-ingestion-job \
   --knowledge-base-id <knowledge-base-id> \
   --data-source-id <data-source-id>
   ```

   Ganti placeholder dengan:
   + `<knowledge-base-id>`- ID dari pembuatan basis pengetahuan
   + `<data-source-id>`- ID dari pembuatan sumber data

1. Pantau status pekerjaan konsumsi menggunakan. [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html)

------

## Sinkronisasi ulang setelah penghapusan sumber data
<a name="kb-multimodal-resync-after-deletion"></a>

Jika Anda menghapus sumber data dan ingin menghapus kontennya dari basis pengetahuan, Anda harus secara eksplisit menyinkronkan ulang basis pengetahuan:

**Untuk menghapus konten sumber data yang dihapus**

1. Hapus sumber data menggunakan konsol atau [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DeleteDataSource.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DeleteDataSource.html)API.

1. Mulai pekerjaan konsumsi baru pada sumber data yang tersisa untuk memperbarui database vektor dan menghapus konten dari sumber data yang dihapus.

1. Verifikasi bahwa kueri tidak lagi mengembalikan hasil dari sumber data yang dihapus.

**catatan**  
Tanpa sinkronisasi ulang, konten dari sumber data yang dihapus akan terus muncul di hasil pencarian meskipun sumber data sudah tidak ada lagi.

# Menguji dan menanyakan basis pengetahuan multimodal
<a name="kb-multimodal-test-and-query"></a>

Setelah menelan konten multimodal, Anda dapat menguji dan menanyakan basis pengetahuan Anda menggunakan konsol atau API. Jenis kueri yang tersedia bergantung pada pendekatan pemrosesan yang Anda pilih.

------
#### [ Console ]

**Untuk menguji basis pengetahuan Anda dari konsol**

1. Dari halaman detail basis pengetahuan Anda, gulir ke bagian **Test knowledge base**.

1. Pilih jenis kueri Anda:
   + **Pengambilan standar saja:** Kueri dan ambil informasi dari sumber data dalam satu Basis Pengetahuan.
   + **Pengambilan dan generasi respons:** Kueri Basis Pengetahuan tunggal dan hasilkan respons berdasarkan hasil yang diambil dengan menggunakan model dasar.
**catatan**  
Jika Anda memiliki konten multimodal, Anda harus menggunakan parser BDA untuk pengambilan dan pembuatan respons.

1. Konfigurasikan opsi tambahan sesuai kebutuhan:
   + **Potongan sumber: Tentukan jumlah maksimum potongan** sumber yang akan dikembalikan
   + **Jenis Pencarian:** Pilih jenis pencarian untuk menyesuaikan strategi kueri
   + **Filter metadata:** Terapkan filter untuk mempersempit hasil pencarian
   + **Pagar pembatas:** Pilih pagar pembatas yang ada atau buat yang baru

1. Masukkan kueri teks atau unggah gambar (hanya Nova Multimodal Embeddings) untuk mencari konten multimodal Anda. Gunakan tombol lampiran untuk mengunggah gambar untuk pencarian kesamaan visual.

1. Tinjau hasilnya, yang meliputi:
   + Potongan konten yang diambil dengan skor relevansi
   + Referensi file sumber dan stempel waktu (untuk audio/video)
   + Metadata termasuk jenis file dan informasi pemrosesan
   + Untuk konten multimedia, kontrol pemutaran dengan pemosisian segmen otomatis berdasarkan stempel waktu yang diambil

------
#### [ API ]

Contoh berikut menunjukkan cara menggunakan Amazon Bedrock Agent Runtime API untuk menanyakan basis pengetahuan multimodal Anda secara terprogram:

**Contoh kueri teks**  
Cari menggunakan input teks:

```
aws bedrock-agent-runtime retrieve \
--knowledge-base-id <knowledge-base-id> \
--retrieval-query text="robot automation in manufacturing"
```

**Contoh kueri gambar (hanya Penyematan Nova Multimodal)**  
Cari menggunakan gambar yang diunggah:

```
{
    "knowledgeBaseId": "<knowledge-base-id>",
    "retrievalQuery": {
        "imageQuery": {
            "inlineContent": {
                "mimeType": "image/jpeg",
                "data": "<base64-encoded-image>"
            }
        }
    }
}
```

------

## Jenis kueri yang didukung
<a name="kb-multimodal-query-types"></a>

**Kueri teks**  
Didukung dengan pendekatan Nova Multimodal Embeddings dan BDA. Cari menggunakan teks bahasa alami untuk menemukan konten yang relevan di semua jenis media.

**Kueri gambar**  
Hanya didukung dengan Nova Multimodal Embeddings. Unggah gambar untuk menemukan konten yang mirip secara visual di basis pengetahuan Anda.

## Memahami metadata respons
<a name="kb-multimodal-response-metadata"></a>

Respons kueri multimodal mencakup metadata tambahan untuk konten multimedia:

**Atribusi sumber**  
Lokasi file asli (SourceURI) dan lokasi penyimpanan multimodal (supplementalURI) untuk akses yang andal

**Metadata temporal**  
Mulai dan akhiri stempel waktu untuk segmen audio dan video, memungkinkan navigasi yang tepat ke konten yang relevan

**Informasi jenis konten**  
Format file, metode pemrosesan, dan indikator modalitas untuk membantu aplikasi menangani berbagai jenis konten dengan tepat

**Struktur metadata basis data vektor**  
Ketika konten multimodal diproses dan disimpan, struktur metadata berikut digunakan dalam database vektor:
+ **bidang teks:** Untuk file multimedia yang diproses dengan Nova Multimodal Embeddings, bidang ini berisi string kosong karena konten disematkan sebagai multimedia asli daripada teks
+ **bidang metadata:** Berisi informasi terstruktur termasuk detail sumber dan referensi konten terkait:

  ```
  {
    "source": {
      "sourceType": "S3",
      "s3Location": {
        "uri": "s3://source-bucket/path/to/file.mp4"
      }
    },
    "relatedContent": [{
      "type": "S3",
      "s3Location": {
        "uri": "s3://multimodal-storage-bucket/processed/file.mp4"
      }
    }]
  }
  ```
+ Bidang **yang dibuat secara otomatis: Bidang** tambahan untuk pemfilteran dan identifikasi:
  + `x-amz-bedrock-kb-source-uri`: URI sumber asli untuk operasi penyaringan
  + `x-amz-bedrock-kb-data-source-id`: Pengidentifikasi sumber data untuk melacak asal konten
  + `x-amz-bedrock-kb-chunk-start-time-in-millis`: Mulai stempel waktu dalam milidetik untuk segmen audio dan video
  + `x-amz-bedrock-kb-chunk-end-time-in-millis`: Akhiri stempel waktu dalam milidetik untuk segmen audio dan video
  + `x-amz-bedrock-kb-source-file-mime-type`: Jenis MIME dari file sumber
  + `x-amz-bedrock-kb-source-file-modality`: Modalitas file sumber (TEKS, GAMBAR, AUDIO, VIDEO)

**penting**  
Aplikasi harus menggunakan stempel waktu yang disediakan untuk mengekstrak dan memutar segmen tertentu dari file audio dan video. Basis pengetahuan mengembalikan referensi ke file lengkap, bukan klip yang telah tersegmentasi sebelumnya.

# Memecahkan masalah basis pengetahuan multimodal
<a name="kb-multimodal-troubleshooting"></a>

Bagian ini memberikan panduan untuk menyelesaikan masalah umum yang dihadapi saat bekerja dengan basis pengetahuan multimodal. Informasi pemecahan masalah diatur oleh batasan umum, skenario kesalahan umum dengan penyebab dan solusinya, dan rekomendasi pengoptimalan kinerja. Gunakan informasi ini untuk mendiagnosis dan menyelesaikan masalah selama penyiapan, konsumsi, atau kueri konten multimodal Anda.

## Batasan umum
<a name="kb-multimodal-general-limitations"></a>

Waspadai keterbatasan saat ini saat bekerja dengan basis pengetahuan multimodal:
+ **Batas ukuran file:** Maksimum 1,5 GB per file video, 1 GB per file audio (Nova Multimodal Embeddings), atau 1,5 GB per file (BDA)
+ **File per pekerjaan konsumsi: Maksimum 15.000 file per pekerjaan** (Nova Multimodal Embeddings) atau 1.000 file per pekerjaan (BDA)
+ **Batas kueri:** Maksimum satu gambar per kueri
+ **Pembatasan sumber data:** Hanya Amazon S3 dan sumber data khusus yang mendukung konten multimodal
+ **Batasan chunking BDA:** Saat menggunakan Otomasi Data Batuan Dasar dengan potongan ukuran tetap, pengaturan persentase tumpang tindih tidak diterapkan pada konten audio dan video
+ **Batas pekerjaan bersamaan BDA: Batas** default 20 pekerjaan BDA bersamaan. Untuk pemrosesan skala besar, pertimbangkan untuk meminta peningkatan kuota layanan
+ **Batasan model Reranker: Model** Reranker tidak didukung untuk konten multimodal
+ **Keterbatasan ringkasan:** Ringkasan tanggapan pengambilan yang mengandung konten non-teks tidak didukung
+ **Batasan input kueri:** Masukan yang berisi teks dan gambar saat ini tidak didukung. Anda dapat menggunakan kueri teks atau gambar, tetapi tidak keduanya secara bersamaan.
+ **Filter konten gambar pagar pembatas:** Saat menggunakan kueri gambar dengan pagar pembatas yang memiliki filter konten gambar yang dikonfigurasi, gambar input akan dievaluasi terhadap pagar pembatas dan dapat diblokir jika melanggar ambang filter yang dikonfigurasi
+ **Ketidakcocokan input dan tipe:** Secara default, input diasumsikan sebagai teks saat tipe tidak ditentukan. Saat menggunakan modalitas selain teks, Anda harus menentukan jenis yang benar

## Kesalahan dan solusi umum
<a name="kb-multimodal-common-errors"></a>

Jika Anda mengalami masalah dengan basis pengetahuan multimodal Anda, tinjau skenario umum ini:

**Kesalahan 4xx saat menggunakan kueri gambar**  
**Penyebab:** Mencoba menggunakan kueri gambar dengan model penyematan khusus teks atau basis pengetahuan yang diproses BDA.  
**Solusi:** Pilih Amazon Nova Multimodal Embeddings saat membuat basis pengetahuan Anda untuk dukungan kueri gambar.

**RAG mengembalikan kesalahan 4xx dengan konten multimodal**  
**Penyebab:** Menggunakan `RetrieveAndGenerate` dengan basis pengetahuan yang hanya berisi konten multimodal dan model Amazon Nova Multimodal Embeddings.  
**Solusi:** Gunakan parser BDA untuk fungsionalitas RAG, atau pastikan basis pengetahuan Anda berisi konten teks.

**Tujuan penyimpanan multimodal diperlukan kesalahan**  
**Penyebab:** Menggunakan Nova Multimodal Embeddings tanpa mengonfigurasi tujuan penyimpanan multimodal.  
**Solusi:** Tentukan tujuan penyimpanan multimodal saat menggunakan Nova Multimodal Embeddings.

**Sumber data dan penyimpanan multimodal menggunakan bucket S3 yang sama**  
**Penyebab:** Mengonfigurasi sumber data dan tujuan penyimpanan multimodal untuk menggunakan bucket Amazon S3 yang sama tanpa awalan penyertaan yang tepat.  
**Solusi:** Gunakan bucket terpisah untuk sumber data dan penyimpanan multimodal, atau konfigurasikan awalan inklusi untuk mencegah pengambilan ulang file media yang diekstraksi.

**Awalan inklusi tidak dapat dimulai dengan “aws/”**  
**Penyebab:** Menggunakan awalan inklusi yang dimulai dengan “aws/” saat sumber data dan tujuan penyimpanan multimodal berbagi bucket Amazon S3 yang sama.  
**Solusi:** Tentukan awalan inklusi yang berbeda. Jalur “aws/” dicadangkan untuk penyimpanan media yang diekstraksi dan tidak dapat digunakan sebagai awalan inklusi untuk menghindari konsumsi ulang konten yang diproses.

**Konsumsi BDA melewatkan konten multimodal**  
**Penyebab:** Basis pengetahuan dibuat tanpa tujuan penyimpanan multimodal, kemudian sumber data BDA ditambahkan dengan konten multimodal.  
**Solusi:** Buat kembali basis pengetahuan dengan tujuan penyimpanan multimodal yang dikonfigurasi untuk memungkinkan pemrosesan BDA file audio, video, dan gambar.

**Basis pengetahuan dibuat tanpa model penyematan multimodal**  
**Penyebab:** Basis pengetahuan dibuat dengan model penyematan khusus teks, membatasi kemampuan multimodal.  
**Solusi:** Buat basis pengetahuan baru dengan Nova Multimodal Embeddings untuk mengaktifkan pemrosesan multimodal asli dan kueri berbasis gambar.

## Mengelola data sementara dengan kebijakan siklus hidup Amazon S3
<a name="kb-multimodal-lifecycle-policy"></a>

Saat menggunakan Nova Multimodal Embeddings, Amazon Bedrock menyimpan data sementara di tujuan penyimpanan multimodal Anda dan mencoba menghapusnya setelah pemrosesan selesai. Sebaiknya terapkan kebijakan siklus hidup pada jalur data transien untuk memastikan bahwa kebijakan tersebut telah kedaluwarsa dengan benar.

------
#### [ Console ]

**Untuk membuat aturan siklus hidup menggunakan konsol**

1. Buka [konsol Amazon S3](https://console.aws.amazon.com/s3).

1. Arahkan ke tujuan penyimpanan multimodal yang telah Anda konfigurasikan untuk Pangkalan Pengetahuan Anda.

1. Pilih tab **Manajemen** dan pilih **Buat aturan siklus hidup**.

1. Untuk **nama aturan Siklus Hidup, masukkan**. **Transient Data Deletion**

1. Di bawah **Jenis filter**, pilih **Batasi cakupan aturan ini menggunakan satu atau beberapa filter**.

1. Untuk **Awalan**, masukkan jalur data sementara untuk basis pengetahuan dan sumber data Anda.

   Ganti nilai placeholder di awalan berikut dengan pengenal Anda yang sebenarnya:

   ```
   aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data
   ```
**penting**  
Jangan menerapkan kebijakan siklus hidup ke seluruh bucket atau awalan “aws/”, karena ini akan menghapus konten multimodal Anda dan menyebabkan kegagalan pengambilan. Hanya gunakan jalur data transien tertentu yang ditunjukkan di atas.

1. Di bawah **Tindakan aturan Siklus Hidup**, pilih **Kedaluwarsa versi objek saat ini**.

1. Untuk **Hari setelah pembuatan objek**, masukkan**1**.

1. Pilih **Buat aturan**.

------
#### [ AWS CLI ]

**Untuk membuat aturan siklus hidup menggunakan AWS CLI**

1. Buat file JSON bernama `lifecycle-policy.json` dengan konten berikut.

   Ganti nilai placeholder dengan pengenal Anda yang sebenarnya:
   + *knowledge-base-id*- Pengidentifikasi basis pengetahuan Anda
   + *data-source-id*- Pengidentifikasi sumber data Anda

   ```
   {
       "Rules": [
           {
               "ID": "TransientDataDeletion",
               "Status": "Enabled",
               "Filter": {
                   "Prefix": "aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data"
               },
               "Expiration": {
                   "Days": 1
               }
           }
       ]
   }
   ```

1. Terapkan kebijakan siklus hidup ke bucket Anda. Ganti *your-multimodal-storage-bucket* dengan nama bucket Anda yang sebenarnya:

   ```
   aws s3api put-bucket-lifecycle-configuration \
       --bucket your-multimodal-storage-bucket \
       --lifecycle-configuration file://lifecycle-policy.json
   ```

1. Verifikasi kebijakan siklus hidup diterapkan:

   ```
   aws s3api get-bucket-lifecycle-configuration \
       --bucket your-multimodal-storage-bucket
   ```

------

*Untuk informasi selengkapnya tentang kebijakan siklus hidup Amazon S3, lihat [Mengelola siklus hidup objek di Panduan Pengguna Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html).*

## Pertimbangan performa
<a name="kb-multimodal-performance-considerations"></a>

Untuk kinerja optimal dengan basis pengetahuan multimodal Anda, pertimbangkan faktor-faktor ini:
+ **Waktu pemrosesan:** Pemrosesan BDA membutuhkan waktu lebih lama karena konversi konten
+ **Latensi kueri:** Kueri gambar mungkin memiliki latensi lebih tinggi daripada kueri teks
+ Durasi **chunking: Durasi** potongan audio/video yang lebih lama meningkatkan waktu pemrosesan tetapi dapat meningkatkan akurasi

# Membangun basis pengetahuan dengan terhubung ke penyimpanan data terstruktur
<a name="knowledge-base-build-structured"></a>

Amazon Bedrock Knowledge Bases memungkinkan Anda untuk terhubung ke penyimpanan data terstruktur, yang berisi data yang sesuai dengan skema yang telah ditentukan. Contoh data terstruktur termasuk tabel dan database. Pangkalan Pengetahuan Amazon Bedrock dapat mengonversi kueri pengguna ke dalam bahasa yang cocok untuk mengekstrak data dari penyimpanan data terstruktur yang didukung. Kemudian dapat menggunakan kueri yang dikonversi untuk mengambil data yang relevan dengan kueri dan menghasilkan respons yang sesuai. Ini memungkinkan Anda untuk menggunakan data terstruktur yang ada secara langsung tanpa harus mengubahnya ke format yang berbeda atau menghasilkan kueri SQL Anda sendiri.

Setelah menyiapkan basis pengetahuan, Anda dapat mengirimkan kueri untuk mengambil data darinya melalui [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)operasi, atau menghasilkan respons dari data yang diambil melalui operasi. [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html) Operasi ini secara mendasar mengubah kueri pengguna menjadi yang sesuai untuk penyimpanan data terstruktur yang terhubung ke basis pengetahuan.

Anda juga memiliki opsi untuk mengonversi kueri secara independen dari pengambilan data dengan menggunakan operasi [GenerateQuery](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerateQuery.html)API. Operasi ini mengubah kueri bahasa alami menjadi kueri SQL yang sesuai dengan sumber data yang ditanyakan. Anda dapat menggunakan operasi ini secara independen dan memasukkannya ke dalam alur kerja Anda.

Pilih topik untuk mempelajari tentang prasyarat dan proses untuk menghubungkan basis pengetahuan Anda ke penyimpanan data terstruktur.

**Topics**
+ [Siapkan mesin kueri dan izin Anda untuk membuat basis pengetahuan dengan penyimpanan data terstruktur](knowledge-base-prereq-structured.md)
+ [Buat basis pengetahuan dengan menghubungkan ke penyimpanan data terstruktur](knowledge-base-structured-create.md)
+ [Sinkronkan penyimpanan data terstruktur Anda dengan basis pengetahuan Amazon Bedrock Anda](kb-data-source-structured-sync-ingest.md)

# Siapkan mesin kueri dan izin Anda untuk membuat basis pengetahuan dengan penyimpanan data terstruktur
<a name="knowledge-base-prereq-structured"></a>

Topik ini menjelaskan izin yang Anda perlukan saat menghubungkan basis pengetahuan Anda ke penyimpanan data terstruktur. Jika Anda berencana untuk menghubungkan basis pengetahuan Amazon Bedrock ke penyimpanan data terstruktur, Anda harus memenuhi prasyarat. Untuk persyaratan izin umum yang harus dipenuhi, lihat[Menyiapkan izin untuk pengguna atau peran untuk membuat dan mengelola basis pengetahuan](knowledge-base-prereq-permissions-general.md).

**penting**  
Menjalankan kueri SQL sewenang-wenang dapat menjadi risiko keamanan untuk aplikasi apa pun. Text-to-SQL Sebaiknya Anda mengambil tindakan pencegahan sesuai kebutuhan, seperti menggunakan peran terbatas, basis data hanya-baca, dan kotak pasir.

Amazon Bedrock Knowledge Bases menggunakan Amazon Redshift sebagai mesin kueri untuk menanyakan penyimpanan data Anda. Mesin kueri mengakses metadata dari penyimpanan data terstruktur dan menggunakan metadata untuk membantu menghasilkan kueri SQL. Amazon Redshift adalah layanan gudang data yang menggunakan SQL untuk menganalisis data terstruktur di seluruh gudang data, database, dan data lake.

## Buat mesin kueri Amazon Redshift
<a name="kb-query-engine-setup-create"></a>

Anda dapat menggunakan Amazon Redshift Serverless atau Amazon Redshift Provisioned tergantung pada kasus penggunaan Anda, dan terhubung ke grup kerja atau cluster untuk gudang data Anda. Data dasar yang dapat ditanyakan oleh mesin Amazon Redshift dapat berupa data yang disimpan secara native di cluster Amazon Redshift, atau data yang terletak di bawah default ( AWS Glue Data Catalog seperti di Amazon S3 antara lain).

Jika Anda sudah membuat mesin kueri, Anda dapat melewati prasyarat ini. Jika tidak, lakukan langkah-langkah berikut untuk menyiapkan mesin kueri Amazon Redshift yang disediakan atau Amazon Redshift Serverless:

**Untuk menyiapkan mesin kueri di Amazon Redshift disediakan**

1. Ikuti prosedur di [Langkah 1: Buat contoh cluster Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/gsg/new-user.html#rs-gsg-launch-sample-cluster) di Panduan Memulai Amazon Redshift.

1. Perhatikan ID cluster.

1. (Opsional) Untuk informasi selengkapnya tentang kluster yang disediakan Amazon Redshift, lihat klaster yang [disediakan Amazon Redshift di Panduan Manajemen](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html) Pergeseran Merah Amazon.

**Untuk menyiapkan mesin kueri di Amazon Redshift Tanpa Server**

1. Ikuti hanya prosedur penyiapan di [Membuat gudang data dengan Amazon Redshift Tanpa Server](https://docs.aws.amazon.com/redshift/latest/gsg/new-user-serverless.html#serverless-console-resource-creation) di Panduan Memulai Amazon Redshift dan konfigurasikan dengan pengaturan default.

1. Perhatikan ARN workgroup.

1. (Opsional) Untuk informasi selengkapnya tentang workgroup Amazon Redshift Tanpa Server, lihat [Workgroups dan namespace di Panduan](https://docs.aws.amazon.com/redshift/latest/mgmt/serverless-workgroup-namespace.html) Manajemen Amazon Redshift.

## Konfigurasikan izin mesin kueri Amazon Redshift
<a name="kb-query-engine-setup-redshift-permissions"></a>

Bergantung pada mesin kueri Amazon Redshift yang Anda pilih, Anda dapat mengonfigurasi izin tertentu. Izin yang Anda konfigurasikan bergantung pada metode otentikasi. Tabel berikut menunjukkan metode otentikasi yang dapat digunakan untuk mesin query yang berbeda:


****  

| Metode otentikasi | Amazon Redshift Disediakan | Amazon Redshift Tanpa Server | 
| --- | --- | --- | 
| IAM | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | 
| Nama pengguna basis data | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | ![\[Red circular icon with an X symbol, indicating cancellation or denial.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-no.png)Tidak | 
| AWS Secrets Manager | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | 

Amazon Bedrock Knowledge Bases menggunakan [peran layanan](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_create_for-service.html) untuk menghubungkan basis pengetahuan ke penyimpanan data terstruktur, mengambil data dari penyimpanan data ini, dan menghasilkan kueri SQL berdasarkan kueri pengguna dan struktur penyimpanan data.

**catatan**  
Jika Anda berencana untuk menggunakan Konsol Manajemen AWS untuk membuat basis pengetahuan, Anda dapat melewati prasyarat ini. Konsol akan membuat peran layanan Amazon Bedrock Knowledge Bases dengan izin yang tepat.

Untuk membuat peran layanan IAM kustom dengan izin yang tepat, ikuti langkah-langkah di [Buat peran untuk mendelegasikan izin ke Layanan AWS dan melampirkan hubungan kepercayaan yang](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_create_for-service.html) ditentukan. [Hubungan kepercayaan](kb-permissions.md#kb-permissions-trust)

Kemudian, tambahkan izin untuk basis pengetahuan Anda untuk mengakses mesin kueri dan database Amazon Redshift Anda. Perluas bagian yang berlaku untuk kasus penggunaan Anda:

### Mesin kueri Anda disediakan oleh Amazon Redshift
<a name="w2aac28c10c27c13c11c15b1"></a>

Lampirkan kebijakan berikut ke peran layanan kustom Anda untuk memungkinkannya mengakses data Anda dan menghasilkan kueri yang menggunakannya:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "RedshiftDataAPIStatementPermissions",
            "Effect": "Allow",
            "Action": [
                "redshift-data:GetStatementResult",
                "redshift-data:DescribeStatement",
                "redshift-data:CancelStatement"
            ],
            "Resource": [
                "*"
            ],
            "Condition": {
                "StringEquals": {
                    "redshift-data:statement-owner-iam-userid": "${aws:userid}"
                }
            }
        },
        {
            "Sid": "RedshiftDataAPIExecutePermissions",
            "Effect": "Allow",
            "Action": [
                "redshift-data:ExecuteStatement"
            ],
            "Resource": [
                "arn:aws:redshift:us-east-1:123456789012:cluster:${Cluster}"
            ]
        },
        {
            "Sid": "SqlWorkbenchAccess",
            "Effect": "Allow",
            "Action": [
                "sqlworkbench:GetSqlRecommendations",
                "sqlworkbench:PutSqlGenerationContext",
                "sqlworkbench:GetSqlGenerationContext",
                "sqlworkbench:DeleteSqlGenerationContext"
            ],
            "Resource": "*"
        },
        {
            "Sid": "GenerateQueryAccess",
            "Effect": "Allow",
            "Action": [
                "bedrock:GenerateQuery"
            ],
            "Resource": "*"
        }
    ]
}
```

------

Anda juga perlu menambahkan izin untuk memungkinkan peran layanan Anda mengautentikasi ke mesin kueri. Perluas bagian untuk melihat izin untuk metode itu.

------
#### [ IAM ]

Untuk mengizinkan peran layanan Anda mengautentikasi ke mesin kueri yang disediakan Amazon Redshift dengan IAM, lampirkan kebijakan berikut ke peran layanan kustom Anda:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "GetCredentialsWithFederatedIAMCredentials",
            "Effect": "Allow",
            "Action": "redshift:GetClusterCredentialsWithIAM",
            "Resource": [
                "arn:aws:redshift:us-east-1:123456789012:dbname:Cluster/database"
            ]
        }
    ]
}
```

------

------
#### [ Database user ]

Untuk mengautentikasi sebagai pengguna database Amazon Redshift, lampirkan kebijakan berikut ke peran layanan:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "GetCredentialsWithClusterCredentials",
            "Effect": "Allow",
            "Action": [
                "redshift:GetClusterCredentials"
            ],
            "Resource": [
                "arn:aws:redshift:us-east-1:123456789012:dbuser:${cluster}/${dbuser}",
                "arn:aws:redshift:us-east-1:123456789012:dbname:${cluster}/${database}"
            ]
        }
    ]
}
```

------

------
#### [ AWS Secrets Manager ]

Untuk mengizinkan peran layanan Anda mengautentikasi ke mesin kueri yang disediakan Amazon Redshift Anda dengan rahasia, lakukan hal AWS Secrets Manager berikut:
+ Lampirkan kebijakan berikut ke peran:

  ```
  {
      "Version": "2012-10-17",		 	 	 
      "Statement": [
          {
              "Sid": "GetSecretPermissions",
              "Effect": "Allow",
              "Action": [
                  "secretsmanager:GetSecretValue"
              ],
              "Resource": [
                  "arn:aws:secretsmanager:${region}:${account}:secret:${secretName}"
              ]
          }
      ]
  }
  ```

------

### Mesin kueri Anda adalah Amazon Redshift Serverless
<a name="w2aac28c10c27c13c11c15b3"></a>

Izin untuk melampirkan bergantung pada metode otentikasi Anda. Perluas bagian untuk melihat izin untuk suatu metode.

------
#### [ IAM ]

Untuk mengizinkan peran layanan Anda mengautentikasi ke mesin kueri tanpa server Amazon Redshift Anda dengan IAM, lampirkan kebijakan berikut ke peran layanan kustom Anda:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "RedshiftServerlessGetCredentials",
            "Effect": "Allow",
            "Action": "redshift-serverless:GetCredentials",
            "Resource": [
                "arn:aws:redshift-serverless:us-east-1:123456789012:workgroup/WorkgroupId"
            ]
        }
    ]
}
```

------

------
#### [ AWS Secrets Manager ]

Untuk mengizinkan peran layanan Anda mengautentikasi ke mesin kueri yang disediakan Amazon Redshift Anda dengan rahasia, lakukan hal AWS Secrets Manager berikut:
+ Lampirkan kebijakan berikut ke peran:

  ```
  {
      "Version": "2012-10-17",		 	 	 
      "Statement": [
          {
              "Sid": "GetSecretPermissions",
              "Effect": "Allow",
              "Action": [
                  "secretsmanager:GetSecretValue"
              ],
              "Resource": [
                  "arn:aws:secretsmanager:${region}:${account}:secret:${secretName}"
              ]
          }
      ]
  }
  ```

------

## Izinkan peran layanan basis pengetahuan untuk mengakses penyimpanan data Anda
<a name="knowledge-base-prereq-structured-db-access"></a>

Pastikan data Anda disimpan di salah satu [penyimpanan data terstruktur yang didukung](knowledge-base-structured-create.md) berikut ini:
+ Amazon Redshift
+ AWS Glue Data Catalog (AWS Lake Formation)

Tabel berikut merangkum metode otentikasi yang tersedia untuk mesin kueri, tergantung pada penyimpanan data Anda:


****  

| Metode otentikasi | Amazon Redshift | AWS Glue Data Catalog (AWS Lake Formation) | 
| --- | --- | --- | 
| IAM | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | 
| Nama pengguna basis data | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | ![\[Red circular icon with an X symbol, indicating cancellation or denial.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-no.png)Tidak | 
| AWS Secrets Manager | ![\[Green circular icon with a white checkmark symbol inside.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-yes.png)Ya | ![\[Red circular icon with an X symbol, indicating cancellation or denial.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/icon-no.png)Tidak | 

Untuk mempelajari cara menyiapkan izin untuk peran layanan Pangkalan Pengetahuan Amazon Bedrock Anda untuk mengakses penyimpanan data Anda dan menghasilkan kueri berdasarkan itu, perluas bagian yang sesuai dengan layanan tempat penyimpanan data Anda berada:

### Amazon Redshift
<a name="w2aac28c10c27c13c13c13b1"></a>

Untuk memberikan akses peran layanan Amazon Bedrock Knowledge Bases ke database Amazon Redshift, gunakan [editor kueri Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2.html) v2 dan jalankan perintah SQL berikut:

1. (Jika Anda mengautentikasi dengan IAM dan pengguna belum dibuat untuk database Anda) Jalankan perintah berikut, yang menggunakan [CREATE USER untuk membuat pengguna](https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_USER.html) database dan memungkinkannya untuk mengautentikasi melalui IAM, ganti *\$1\$1service-role\$1* dengan nama peran layanan Amazon Bedrock Knowledge Bases kustom yang Anda buat:

   ```
   CREATE USER "IAMR:${service-role}" WITH PASSWORD DISABLE;
   ```
**penting**  
Jika Anda menggunakan peran layanan Amazon Bedrock Knowledge Bases yang dibuat untuk Anda di konsol dan kemudian [menyinkronkan penyimpanan data](kb-data-source-structured-sync-ingest.md) Anda sebelum Anda melakukan langkah ini, pengguna akan dibuat untuk Anda, tetapi sinkronisasi akan gagal karena pengguna belum diberikan izin untuk mengakses penyimpanan data Anda. Anda harus melakukan langkah berikut sebelum menyinkronkan.

1. Berikan izin identitas untuk mengambil informasi dari database Anda dengan menjalankan perintah [GRANT](https://docs.aws.amazon.com/redshift/latest/dg/r_GRANT.html).

------
#### [ IAM ]

   ```
   GRANT SELECT ON ALL TABLES IN SCHEMA ${schemaName} TO "IAMR:${serviceRole}";
   ```

------
#### [ Database user ]

   ```
   GRANT SELECT ON ALL TABLES IN SCHEMA ${schemaName} TO "${dbUser}";
   ```

------
#### [ AWS Secrets Manager username ]

   ```
   GRANT SELECT ON ALL TABLES IN SCHEMA ${schemaName} TO "${secretsUsername}";
   ```

------
**penting**  
Jangan memberikan`CREATE`,`UPDATE`, atau `DELETE` akses. Pemberian tindakan ini dapat menyebabkan modifikasi data Anda yang tidak diinginkan.

   Untuk kontrol berbutir halus pada tabel yang dapat diakses, Anda dapat mengganti nama tabel `ALL TABLES` tertentu dengan notasi berikut:. *\$1\$1schemaName\$1* *\$1\$1tableName\$1* Untuk informasi selengkapnya tentang notasi ini, lihat bagian **Query objects** di [Cross-database queries](https://docs.aws.amazon.com/redshift/latest/dg/cross-database-overview.html).

------
#### [ IAM ]

   ```
   GRANT SELECT ON ${schemaName}.${tableName} TO "IAMR:${serviceRole}";
   ```

------
#### [ Database user ]

   ```
   GRANT SELECT ON ${schemaName}.${tableName} TO "${dbUser}";
   ```

------
#### [ AWS Secrets Manager username ]

   ```
   GRANT SELECT ON ${schemaName}.${tableName} TO "${secretsUsername}";
   ```

------

1. Jika Anda membuat skema baru dalam database Redshift, jalankan perintah berikut untuk memberikan izin identitas terhadap skema baru.

   ```
   GRANT USAGE ON SCHEMA ${schemaName} TO "IAMR:${serviceRole}";
   ```

### AWS Glue Data Catalog
<a name="w2aac28c10c27c13c13c13b3"></a>

Untuk memberikan akses peran layanan Amazon Bedrock Knowledge Bases ke penyimpanan AWS Glue Data Catalog data Anda, gunakan [editor kueri Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2.html) v2 dan jalankan perintah SQL berikut:

1. Jalankan perintah berikut, yang menggunakan [CREATE USER](https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_USER.html) untuk membuat pengguna database dan memungkinkannya untuk mengautentikasi melalui IAM, ganti *\$1\$1service-role\$1* dengan nama peran layanan Amazon Bedrock Knowledge Bases kustom yang Anda buat:

   ```
   CREATE USER "IAMR:${service-role}" WITH PASSWORD DISABLE;
   ```
**penting**  
Jika Anda menggunakan peran layanan Amazon Bedrock Knowledge Bases yang dibuat untuk Anda di konsol dan kemudian [menyinkronkan penyimpanan data](kb-data-source-structured-sync-ingest.md) Anda sebelum Anda melakukan langkah ini, pengguna akan dibuat untuk Anda, tetapi sinkronisasi akan gagal karena pengguna belum diberikan izin untuk mengakses penyimpanan data Anda. Anda harus melakukan langkah berikut sebelum menyinkronkan.

1. Berikan izin peran layanan untuk mengambil informasi dari database Anda dengan menjalankan perintah [GRANT](https://docs.aws.amazon.com/redshift/latest/dg/r_GRANT.html) berikut:

   ```
   GRANT USAGE ON DATABASE awsdatacatalog TO "IAMR:${serviceRole}";
   ```
**penting**  
Jangan memberikan`CREATE`,`UPDATE`, atau `DELETE` akses. Pemberian tindakan ini dapat menyebabkan modifikasi data Anda yang tidak diinginkan.

1. Untuk mengizinkan akses ke AWS Glue Data Catalog database Anda, lampirkan izin berikut ke peran layanan:

------
#### [ JSON ]

****  

   ```
   {
       "Version":"2012-10-17",		 	 	 
       "Statement": [
           {
               "Sid": "VisualEditor0",
               "Effect": "Allow",
               "Action": [
                   "glue:GetDatabases",
                   "glue:GetDatabase",
                   "glue:GetTables",
                   "glue:GetTable",
                   "glue:GetPartitions",
                   "glue:GetPartition",
                   "glue:SearchTables"
               ],
               "Resource": [
                   "arn:aws:glue:us-east-1:123456789012:table/${DatabaseName}/${TableName}",
                   "arn:aws:glue:us-east-1:123456789012:database/${DatabaseName}",
                   "arn:aws:glue:us-east-1:123456789012:catalog"
               ]
           }
       ]
   }
   ```

------

1. Berikan izin ke peran layanan Anda melalui AWS Lake Formation (untuk mempelajari lebih lanjut tentang Lake Formation dan hubungannya dengan Amazon Redshift, [lihat Sumber data untuk Redshift](https://docs.aws.amazon.com/redshift/latest/dg/copy-parameters-data-source.html)) dengan melakukan hal berikut:

   1. Masuk ke Konsol Manajemen AWS, dan buka konsol Lake Formation di [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com/lakeformation/).

   1. Pilih **Izin data** dari panel navigasi kiri.

   1. Berikan izin ke peran layanan yang Anda gunakan untuk Pangkalan Pengetahuan Amazon Bedrock.

   1. Berikan izin **Jelaskan** dan **Pilih** untuk database dan tabel Anda.

1. Bergantung pada sumber data yang Anda gunakan AWS Glue Data Catalog, Anda mungkin perlu menambahkan izin untuk mengakses sumber data tersebut (untuk informasi selengkapnya, lihat [AWS Glue ketergantungan pada yang lain Layanan AWS](https://docs.aws.amazon.com/glue/latest/dg/dependency-on-other-services.html)). Misalnya, jika sumber data Anda berada di lokasi Amazon S3, Anda harus menambahkan pernyataan berikut ke kebijakan di atas.

   ```
   {
       "Sid": "Statement1",
       "Effect": "Allow",
       "Action": [
           "s3:ListBucket",
           "s3:GetObject"
       ],
       "Resource": [
           "arn:aws:s3:::${BucketName}",
           "arn:aws:s3:::${BucketName}/*"
       ]
   }
   ```

1. (Opsional) Jika Anda menggunakan AWS KMS untuk mengenkripsi data di Amazon S3 AWS Glue Data Catalog atau, maka Anda perlu menambahkan izin ke peran untuk mendekripsi data pada kunci KMS.

   ```
   {
       "Action": [
           "kms:Decrypt"
       ],
       "Resource": [
           "arn:aws:kms:${Region}:${Account}:key/{KmsId}",
           "arn:aws:kms:${Region}:${Account}:key/{KmsId}"
       ],
       "Effect": "Allow"
   }
   ```

# Buat basis pengetahuan dengan menghubungkan ke penyimpanan data terstruktur
<a name="knowledge-base-structured-create"></a>

Untuk menghubungkan basis pengetahuan ke penyimpanan data terstruktur, Anda menentukan komponen berikut:
+ 

**Konfigurasi mesin kueri**  
Konfigurasi untuk layanan komputasi yang akan mengeksekusi query SQL yang dihasilkan. Mesin kueri digunakan untuk mengonversi kueri pengguna bahasa alami menjadi kueri SQL yang dapat digunakan untuk mengekstrak data dari penyimpanan data Anda. Anda dapat memilih Amazon Redshift sebagai mesin kueri Anda. Saat memilih konfigurasi ini, Anda harus menentukan:
  + Metadata koneksi komputasi seperti ID cluster atau ARN workgroup tergantung pada mesin kueri yang dipilih.
  + Metode otentikasi untuk menggunakan mesin kueri, yang dapat menggunakan peran layanan IAM dengan izin yang sesuai, pengguna database mesin kueri, atau AWS Secrets Manager rahasia yang ditautkan ke kredenal database Anda.
+ 

**Konfigurasi penyimpanan**  
Konfigurasi untuk penyimpanan data yang berisi data Anda. Anda dapat terhubung ke Amazon Redshift Provisioned atau Amazon Redshift Tanpa Server dan menggunakan Amazon Redshift atau sebagai penyimpanan data Anda. AWS Glue Data Catalog 
+ 

**(Opsional) Konfigurasi kueri**  
Anda dapat menggunakan konfigurasi kueri opsional untuk meningkatkan akurasi pembuatan SQL:
  + **Waktu kueri maksimum** — Jumlah waktu setelah waktu kueri habis.
  + **Deskripsi** — Menyediakan metadata atau informasi tambahan tentang tabel atau kolom. Anda dapat menyertakan deskripsi tabel atau kolom, catatan penggunaan, atau atribut tambahan apa pun. Deskripsi yang Anda tambahkan dapat meningkatkan pembuatan kueri SQL dengan memberikan konteks dan informasi tambahan tentang struktur tabel atau kolom.
  + **Inklusi dan Pengecualian** - Menentukan satu set tabel atau kolom untuk dimasukkan atau dikecualikan untuk generasi SQL. Bidang ini sangat penting jika Anda ingin membatasi cakupan kueri SQL ke subset yang ditentukan dari tabel atau kolom yang tersedia. Opsi ini dapat membantu mengoptimalkan proses pembuatan dengan mengurangi referensi tabel atau kolom yang tidak perlu.

    Jika Anda menentukan inklusi, semua tabel dan kolom lainnya diabaikan. Jika Anda menentukan pengecualian, tabel dan kolom yang Anda tentukan akan diabaikan.
**catatan**  
Inklusi dan pengecualian bukan pengganti pagar pembatas dan hanya dimaksudkan untuk meningkatkan akurasi model.
  + **Kueri yang dikuratori** — Satu set contoh pertanyaan dan jawaban yang telah ditentukan sebelumnya. Pertanyaan ditulis sebagai kueri bahasa alami (NLQ) dan jawaban adalah kueri SQL yang sesuai. Contoh-contoh ini membantu proses pembuatan SQL dengan memberikan contoh jenis kueri yang harus dihasilkan. Mereka berfungsi sebagai titik referensi untuk meningkatkan akurasi dan relevansi output SQL generatif.

Perluas bagian yang sesuai dengan kasus penggunaan Anda:

## Gunakan konsol
<a name="knowledge-base-structured-create-console"></a>

Untuk menyambung ke penyimpanan data terstruktur menggunakan Konsol Manajemen AWS, lakukan hal berikut:

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, pilih **Buat** dan kemudian pilih **Basis pengetahuan dengan penyimpanan data terstruktur**.

1. Siapkan detail berikut untuk basis pengetahuan:

   1. (Opsional) Ubah nama default dan berikan deskripsi untuk basis pengetahuan Anda.

   1. Pilih mesin kueri yang akan digunakan untuk mengambil data dari penyimpanan data Anda.

   1. Pilih peran layanan IAM dengan izin yang tepat untuk membuat dan mengelola basis pengetahuan ini. Anda dapat membiarkan Amazon Bedrock membuat peran layanan atau memilih peran khusus yang telah Anda buat. Untuk informasi selengkapnya tentang membuat peran kustom, lihat[Siapkan mesin kueri dan izin Anda untuk membuat basis pengetahuan dengan penyimpanan data terstruktur](knowledge-base-prereq-structured.md).

   1. (Opsional) Tambahkan tag untuk dikaitkan dengan basis pengetahuan Anda. Untuk informasi selengkapnya, lihat [Menandai sumber daya Amazon Bedrock](tagging.md).

   1. Pilih **Berikutnya**.

1. Konfigurasikan mesin kueri Anda:

   1. Pilih layanan tempat Anda membuat cluster atau workgroup. Kemudian pilih cluster atau workgroup yang akan digunakan.

   1. Pilih metode otentikasi dan berikan bidang yang diperlukan.

   1. Pilih penyimpanan data untuk menyimpan metadata Anda. Kemudian, pilih atau masukkan nama database.

   1. (Opsional) Ubah konfigurasi kueri seperlunya. Lihat awal topik ini untuk informasi lebih lanjut tentang konfigurasi yang berbeda.

   1. Pilih **Berikutnya**.

1. Tinjau konfigurasi basis pengetahuan Anda dan edit bagian apa pun yang diperlukan. Konfirmasikan untuk membuat basis pengetahuan Anda.

## Gunakan API
<a name="knowledge-base-structured-create-api"></a>

Untuk menyambung ke penyimpanan data terstruktur menggunakan Amazon Bedrock API, kirim [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html)permintaan dengan [titik akhir waktu build Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) dengan badan permintaan umum berikut:

```
{
    "name": "string",
    "roleArn": "string",
    "knowledgeBaseConfiguration": {
        "type": "SQL",
        "sqlKnowledgeBaseConfiguration": [SqlKnowledgeBaseConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_SqlKnowledgeBaseConfiguration.html)
    },
    "description": "string",
    "clientToken": "string",
    "tags": {
        "string": "string"
    }
}
```

Bidang berikut diperlukan.


****  

| Bidang | Deskripsi dasar | 
| --- | --- | 
| Nama | Nama untuk basis pengetahuan | 
| roleArn | [Peran layanan basis pengetahuan](kb-permissions.md) dengan izin yang tepat. Anda dapat menggunakan konsol untuk secara otomatis membuat peran layanan dengan izin yang tepat. | 
| knowledgeBaseConfiguration | Berisi konfigurasi untuk basis pengetahuan. Untuk database terstruktur, tentukan SQL sebagai type dan sertakan sqlKnowledgeBaseConfiguration bidang. | 

Bidang berikut adalah opsional.


****  

| Bidang | Gunakan | 
| --- | --- | 
| deskripsi | Untuk memasukkan deskripsi untuk basis pengetahuan. | 
| clientToken | Untuk memastikan permintaan API selesai hanya sekali. Untuk informasi selengkapnya, lihat [Memastikan idempotensi](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html). | 
| tag | Untuk mengaitkan tag dengan aliran. Untuk informasi selengkapnya, lihat [Menandai sumber daya Amazon Bedrock](tagging.md). | 

`SQLKnowledgeBaseConfiguration`Tergantung pada mesin kueri yang Anda gunakan. Untuk Amazon Redshift, tentukan `type` bidang sebagai `REDSHIFT` dan sertakan `redshiftConfiguration` bidang, yang memetakan ke file. [RedshiftConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftConfiguration.html) Untuk [RedshiftConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftConfiguration.html), Anda mengkonfigurasi bidang berikut:

### queryEngineConfiguration
<a name="w2aac28c10c27c15b9b3c17b1"></a>

Anda dapat mengonfigurasi jenis mesin kueri berikut:

#### Amazon Redshift Disediakan
<a name="w2aac28c10c27c15b9b3c17b1b5b1"></a>

Jika database Amazon Redshift Anda disediakan pada node komputasi khusus, nilai `queryEngineConfiguration` bidang harus dalam format berikut: [RedshiftQueryEngineConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftQueryEngineConfiguration.html)

```
{
    "type": "PROVISIONED",
    "provisionedConfiguration": {
        "clusterIdentifier": "string",
        "authConfiguration": [RedshiftProvisionedAuthConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftProvisionedAuthConfiguration.html)
    },
}
```

Tentukan ID cluster di `clusterIdentifier` lapangan. [RedshiftProvisionedAuthConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftProvisionedAuthConfiguration.html)Tergantung pada jenis otorisasi yang Anda gunakan. Pilih tab yang cocok dengan metode otorisasi Anda:

------
#### [ IAM role ]

Jika Anda mengotorisasi dengan peran IAM Anda, Anda hanya perlu menentukan `IAM` sebagai jenis di bidang [RedshiftProvisionedAuthConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftProvisionedAuthConfiguration.html)tanpa tambahan.

```
{
    "type": "IAM"
}
```

------
#### [ Temporary credentials user name ]

Jika Anda mengotorisasi dengan nama pengguna database, tentukan `type` sebagai `USERNAME` dan tentukan nama pengguna di `databaseUser` bidang di`RedshiftProvisionedAuthConfig`:

```
{
    "type": "USERNAME",
    "databaseUser": "string"
}
```

------
#### [ AWS Secrets Manager ]

Jika Anda mengotorisasi dengan AWS Secrets Manager, tentukan `type` sebagai `USERNAME_PASSWORD` dan tentukan ARN rahasia di bidang `usernamePasswordSecretArn` di: `RedshiftProvisionedAuthConfig`

```
{
    "type": "USERNAME_PASSWORD",
    "usernamePasswordSecretArn": "string"
}
```

------

#### Amazon Redshift Tanpa Server
<a name="w2aac28c10c27c15b9b3c17b1b5b3"></a>

Jika Anda menggunakan Amazon Redshift Tanpa Server, nilai `queryConfiguration` bidang harus [RedshiftQueryEngineConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftQueryEngineConfiguration.html)dalam format berikut:

```
{
    "type": "SERVERLESS",
    "serverlessConfiguration": {
        "workgroupArn": "string",
        "authConfiguration": 
    }
}
```

Tentukan ARN dari workgroup Anda di lapangan. `workgroupArn` [RedshiftServerlessAuthConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftServerlessAuthConfiguration.html)Tergantung pada jenis otorisasi yang Anda gunakan. Pilih tab yang cocok dengan metode otorisasi Anda:

------
#### [ IAM role ]

Jika Anda mengotorisasi dengan peran IAM Anda, Anda hanya perlu menentukan `IAM` sebagai jenis di bidang `RedshiftServerlessAuthConfiguration` tanpa tambahan.

```
{
    "type": "IAM"
}
```

------
#### [ AWS Secrets Manager ]

Jika Anda mengotorisasi dengan AWS Secrets Manager, tentukan `type` sebagai `USERNAME_PASSWORD` dan tentukan ARN rahasia di bidang `usernamePasswordSecretArn` di: `RedshiftServerlessAuthConfiguration`

```
{
    "type": "USERNAME_PASSWORD",
    "usernamePasswordSecretArn": "string"
}
```

------

### StorageConfigurations
<a name="w2aac28c10c27c15b9b3c17b3"></a>

Bidang ini memetakan ke array yang berisi satu [RedshiftQueryEngineStorageConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_RedshiftQueryEngineStorageConfiguration.html), yang formatnya bergantung pada tempat data Anda disimpan.

#### AWS Glue Data Catalog
<a name="w2aac28c10c27c15b9b3c17b3b5b1"></a>

Jika data Anda disimpan AWS Glue Data Catalog, `RedshiftQueryEngineStorageConfiguration` harus dalam format berikut:

```
{
    "type": "AWS_DATA_CATALOG",
    "awsDataCatalogConfiguration": {
        "tableNames": ["string"]
    }
}
```

Tambahkan nama setiap tabel yang ingin Anda hubungkan dengan basis pengetahuan Anda dalam array yang `tableNames` dipetakan.

**catatan**  
Masukkan nama tabel dalam pola yang dijelaskan dalam [kueri Cross-database ()`${databaseName}.${tableName}`.](https://docs.aws.amazon.com/redshift/latest/dg/cross-database-overview.html) Anda dapat memasukkan semua tabel dengan menentukan. `${databaseName.*}`

#### Basis data Amazon Redshift
<a name="w2aac28c10c27c15b9b3c17b3b5b3"></a>

Jika data Anda disimpan dalam database Amazon Redshift, `RedshiftQueryEngineStorageConfiguration` seharusnya dalam format berikut:

```
{
    "type": "string",
    "redshiftConfiguration": {
        "databaseName": "string"
    }
}
```

Tentukan nama database Amazon Redshift Anda di bidang. `databaseName`

**catatan**  
Masukkan nama tabel dalam pola yang dijelaskan dalam [kueri Cross-database ()`${databaseName}.${tableName}`.](https://docs.aws.amazon.com/redshift/latest/dg/cross-database-overview.html) Anda dapat memasukkan semua tabel dengan menentukan. `${databaseName.*}`

Jika database Anda dipasang melalui Amazon SageMaker AI Lakehouse, nama database ada dalam format. *\$1\$1db\$1@\$1\$1schema\$1*

### queryGenerationConfiguration
<a name="w2aac28c10c27c15b9b3c17b5"></a>

Bidang ini memetakan ke hal-hal berikut [QueryGenerationConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationConfiguration.html)yang dapat Anda gunakan untuk mengonfigurasi bagaimana data Anda ditanyakan:

```
{
    "executionTimeoutSeconds": number,
    "generationContext": {
        "tables": [
            {
                "name": "string",
                "description": "string",
                "inclusion": "string",
                "columns": [
                    {
                        "name": "string",
                        "description": "string",
                        "inclusion": "string"
                    },
                    ...
                ]
            },
            ...
        ],
        "curatedQueries": [
            {
                "naturalLanguage": "string",
                "sql": "string"
            },
            ...
        ]
    }
}
```

Jika Anda ingin kueri habis waktu, tentukan durasi batas waktu dalam detik di `executionTimeoutSeconds` bidang.

`generationContext`Bidang memetakan ke [QueryGenerationContext](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationContext.html)objek di mana Anda dapat mengonfigurasi sebanyak mungkin opsi berikut yang Anda butuhkan.

**penting**  
Jika Anda menyertakan konteks generasi, mesin kueri melakukan upaya terbaik untuk menerapkannya saat membuat SQL. Konteks generasi tidak deterministik dan hanya dimaksudkan untuk meningkatkan akurasi model. Untuk memastikan akurasi, verifikasi kueri SQL yang dihasilkan.

Untuk informasi tentang konteks pembuatan yang dapat Anda sertakan, perluas bagian berikut:

#### Tambahkan deskripsi untuk tabel atau kolom dalam database
<a name="w2aac28c10c27c15b9b3c17b5c15b1"></a>

Untuk meningkatkan akurasi pembuatan SQL untuk menanyakan database, Anda dapat memberikan deskripsi untuk tabel atau kolom yang menyediakan lebih banyak konteks daripada nama tabel atau kolom pendek. Anda dapat melakukan tindakan berikut:
+ Untuk menambahkan deskripsi untuk tabel, sertakan [QueryGenerationTable](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationTable.html)objek dalam `tables` array. Dalam objek itu, tentukan nama tabel di `name` bidang dan deskripsi di `description` bidang, seperti pada contoh berikut:

  ```
  {
      "name": "database.schema.tableA",
      "description": "Description for Table A"
  }
  ```
+ Untuk menambahkan deskripsi untuk kolom, sertakan [QueryGenerationTable](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationTable.html)objek dalam `tables` array. Dalam objek itu, tentukan nama tabel di `name` bidang dan sertakan `columns` bidang, yang memetakan ke array [QueryGenerationColumn](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationColumn.html). Dalam sebuah `QueryGenerationColumn` objek, sertakan nama kolom di `name` bidang dan deskripsi di `description` bidang, seperti pada contoh berikut:

  ```
  {
      "name": "database.schema.tableA",
      "columns": [
          {
              "name": "Column A",
              "description": "Description for Column A"
          }
      ]
  }
  ```
+ Anda dapat menambahkan deskripsi untuk tabel dan kolom di dalamnya, seperti pada contoh berikut:

  ```
  {
      "name": "database.schema.tableA",
      "description": "Description for Table A",
      "columns": [
          {
              "name": "columnA",
              "description": "Description for Column A"
          }
      ]
  }
  ```
**catatan**  
Masukkan nama tabel dan kolom dalam pola yang dijelaskan dalam [kueri lintas basis data](https://docs.aws.amazon.com/redshift/latest/dg/cross-database-overview.html). Jika database Anda masuk AWS Glue Data Catalog, formatnya adalah`awsdatacatalog.gluedatabase.table`.

#### Sertakan atau kecualikan tabel atau kolom dalam database
<a name="w2aac28c10c27c15b9b3c17b5c15b3"></a>

Anda dapat menyarankan tabel atau kolom untuk menyertakan atau mengecualikan saat membuat SQL dengan menggunakan `inclusion` bidang di [QueryGenerationTable](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationTable.html)dan [QueryGenerationColumn](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationColumn.html)objek. Anda dapat menentukan salah satu nilai berikut di `inclusion` bidang:
+ INCLUDE - Hanya tabel atau kolom yang Anda tentukan disertakan sebagai konteks saat menghasilkan SQL.
+ EXCLUDE - Tabel atau kolom yang Anda tentukan dikecualikan sebagai konteks saat menghasilkan SQL.

Anda dapat menentukan apakah akan menyertakan atau mengecualikan tabel atau kolom dengan cara berikut:
+ Untuk menyertakan atau mengecualikan tabel, sertakan [QueryGenerationTable](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationTable.html)objek dalam `tables` array. Dalam objek itu, tentukan nama tabel di `name` bidang dan apakah akan menyertakan atau mengecualikannya di `inclusion` bidang, seperti pada contoh berikut:

  ```
  {
      "name": "database.schema.tableA",
      "inclusion": "EXCLUDE"
  }
  ```

  Mesin kueri tidak menambahkan `Table A` konteks tambahan untuk menghasilkan SQL.
+ Untuk menyertakan atau mengecualikan kolom, sertakan [QueryGenerationTable](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationTable.html)objek dalam `tables` array. Dalam objek itu, tentukan nama tabel di `name` bidang dan sertakan `columns` bidang, yang memetakan ke array [QueryGenerationColumn](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationColumn.html). Dalam sebuah `QueryGenerationColumn` objek, sertakan nama kolom di `name` bidang dan apakah akan menyertakan atau mengecualikannya di `inclusion` bidang, seperti pada contoh berikut:

  ```
  {
      "name": "database.schema.tableA",
      "columns": [
          {
              "name": "database.schema.tableA.columnA",
              "inclusion": "EXCLUDE"
          }
      ]
  }
  ```

  Generasi SQL mengabaikan `Column A` `Table A` dalam konteks saat menghasilkan SQL.
+ Anda dapat menggabungkan tabel dan kolom saat menentukan inklusi atau pengecualian, seperti pada contoh berikut:

  ```
  {
      "name": "database.schema.tableA",
      "inclusion": "INCLUDE",
      "columns": [
          {
              "name": "database.schema.tableA.columnA",
              "inclusion": "EXCLUDE"
          }
      ]
  }
  ```

  Generasi SQL termasuk`Table A`, tetapi mengecualikan `Column A` di dalamnya saat menambahkan konteks untuk menghasilkan SQL.

**penting**  
Pengecualian tabel dan kolom bukan pengganti pagar pembatas. Inklusi dan pengecualian tabel dan kolom ini digunakan sebagai konteks tambahan untuk model untuk dipertimbangkan saat menghasilkan SQL.

#### Berikan contoh mesin kueri pemetaan bahasa alami ke kueri SQL
<a name="w2aac28c10c27c15b9b3c17b5c15b5"></a>

Untuk meningkatkan akurasi mesin kueri dalam mengonversi kueri pengguna menjadi kueri SQL, Anda dapat memberikan contoh di `curatedQueries` bidang di [QueryGenerationContext](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_QueryGenerationContext.html)objek, yang memetakan ke array objek. [CuratedQuery](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CuratedQuery.html) Setiap objek berisi bidang-bidang berikut:
+ NaturalLanguage — Contoh kueri dalam bahasa alami.
+ sql — Query SQL yang sesuai dengan query bahasa alami.

# Sinkronkan penyimpanan data terstruktur Anda dengan basis pengetahuan Amazon Bedrock Anda
<a name="kb-data-source-structured-sync-ingest"></a>

Setelah Anda menghubungkan basis pengetahuan Anda ke penyimpanan data terstruktur, Anda melakukan sinkronisasi untuk memulai proses konsumsi metadata sehingga data dapat diambil. Metadata ini memungkinkan Amazon Bedrock Knowledge Bases untuk menerjemahkan permintaan pengguna ke dalam kueri untuk database yang terhubung.

Setiap kali Anda membuat modifikasi pada skema database Anda, Anda perlu menyinkronkan perubahan.

Untuk mempelajari cara memasukkan metadata Anda ke dalam basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk memasukkan data Anda ke dalam basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda**

1. Buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock/](https://console.aws.amazon.com/bedrock/).

1. Dari panel navigasi kiri, pilih **Basis pengetahuan dan pilih basis** pengetahuan Anda.

1. Di bagian **Sumber data**, pilih **Sinkronkan** untuk memulai proses konsumsi metadata. Untuk menghentikan sinkronisasi sumber data yang saat ini, pilih **Berhenti**. Sumber data saat ini harus disinkronkan untuk menghentikan sinkronisasi sumber data. Anda dapat memilih **Sinkronkan** lagi untuk menelan sisa data Anda.

1. Ketika konsumsi data selesai, spanduk sukses hijau muncul jika berhasil.

1. Anda dapat memilih sumber data untuk melihat **riwayat Sinkronisasi**. Pilih **Lihat peringatan** untuk melihat mengapa pekerjaan konsumsi data gagal.

------
#### [ API ]

Untuk memasukkan data Anda ke basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda, kirim [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt).

Gunakan yang `ingestionJobId` dikembalikan dalam respons dalam [GetIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html)permintaan dengan [titik akhir waktu build Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) untuk melacak status pekerjaan konsumsi.

Anda dapat melihat informasi untuk semua pekerjaan konsumsi untuk sumber data dengan mengirimkan [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html)permintaan dengan titik akhir waktu pembuatan [Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt).

Untuk menghentikan tugas konsumsi data yang sedang berjalan, kirim [StopIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StopIngestionJob.html)permintaan dengan titik akhir waktu pembuatan [Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Anda dapat mengirim `StartIngestionJob` permintaan lagi untuk menelan sisa data Anda saat Anda siap.

------

**penting**  
Jika Anda menggunakan peran layanan Amazon Bedrock Knowledge Bases yang dibuat untuk Anda di konsol dan kemudian menyinkronkan penyimpanan data Anda sebelum memberikan akses ke database Anda ke peran otentikasi yang Anda gunakan, sinkronisasi akan gagal karena pengguna belum diberikan izin untuk mengakses penyimpanan data Anda. Untuk informasi tentang pemberian izin ke peran untuk mengakses penyimpanan data Anda, lihat. [Izinkan peran layanan basis pengetahuan untuk mengakses penyimpanan data Anda](knowledge-base-prereq-structured.md#knowledge-base-prereq-structured-db-access)

# Bangun basis pengetahuan Amazon Bedrock dengan indeks Amazon Kendra GenAI
<a name="knowledge-base-build-kendra-genai-index"></a>

Dengan Pangkalan Pengetahuan Amazon Bedrock, Anda dapat membangun basis pengetahuan dari indeks Amazon Kendra GenAI untuk membuat asisten digital bertenaga Retrieval Augmented Generation (RAG) yang lebih canggih dan akurat. Dengan menggabungkan indeks Amazon Kendra GenAI dengan Pangkalan Pengetahuan Amazon Bedrock, Anda dapat:
+ Gunakan kembali konten yang diindeks di beberapa aplikasi Amazon Bedrock tanpa membangun kembali indeks atau menelan ulang data.
+ Manfaatkan kemampuan GenAI canggih dari Amazon Bedrock sambil memanfaatkan pengambilan informasi Amazon Kendra dengan akurasi tinggi.
+ Sesuaikan perilaku asisten digital Anda menggunakan alat Amazon Bedrock sambil mempertahankan akurasi semantik indeks Amazon Kendra GenAI.

*Untuk informasi selengkapnya tentang penggunaan indeks Amazon Kendra GenAI, lihat indeks [Amazon Kendra GenAI di Panduan Pengembang Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/hiw-index-types.html#kendra-gen-ai-index).*

**Topics**
+ [Buat basis pengetahuan Amazon Bedrock dengan indeks Amazon Kendra GenAI](knowledge-base-kendra-genai-index-create.md)

# Buat basis pengetahuan Amazon Bedrock dengan indeks Amazon Kendra GenAI
<a name="knowledge-base-kendra-genai-index-create"></a>

 *Untuk informasi selengkapnya tentang penggunaan indeks Amazon Kendra GenAI, lihat indeks [Amazon Kendra GenAI di Panduan Pengembang Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/hiw-index-types.html#kendra-gen-ai-index).*

Anda dapat membuat basis pengetahuan Amazon Bedrock dengan indeks Amazon Kendra GenAI menggunakan konsol Amazon Bedrock atau Amazon Bedrock API. Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

**catatan**  
Anda tidak dapat membuat basis pengetahuan dengan pengguna root. Sebelum Anda mulai, masuk dengan pengguna AWS Identity and Access Management (IAM).

**penting**  
Untuk membuat basis pengetahuan dengan indeks Amazon Kendra GenAI menggunakan API, Anda harus memiliki indeks yang ada. Dengan API, Anda tidak dapat membuat indeks saat membuat basis pengetahuan. Jika Anda ingin membuat indeks saat membuat basis pengetahuan, maka Anda harus menggunakan konsol.

------
#### [ Console ]

**Untuk membuat basis pengetahuan dengan indeks Amazon Kendra GenAI**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, pilih **Buat**.

1. Pilih **Basis Pengetahuan dengan indeks Kendra GenAI**.

1. (Opsional) Di bawah **detail basis Pengetahuan**, ubah nama default dan berikan deskripsi untuk basis pengetahuan Anda.

1. Di bawah **izin IAM**, pilih peran IAM yang menyediakan izin Amazon Bedrock untuk mengakses lainnya yang diperlukan. Layanan AWS Anda dapat meminta Amazon Bedrock membuat peran layanan untuk Anda, atau Anda dapat memilih [peran khusus yang telah Anda buat](kb-permissions.md).

1. Pilih untuk **Membuat dan menggunakan peran layanan baru** atau **menggunakan peran layanan yang ada**.

1. Pilih untuk **membuat indeks Amazon Kendra GenAI baru atau gunakan yang sudah ada indeks** **Amazon Kendra** GenAI.

1. (Opsional) Di bawah **Konfigurasi tambahan**, lakukan salah satu hal berikut:
   + Konfigurasikan kunci yang dikelola pelanggan AWS Key Management Service (AWS KMS) untuk mengenkripsi basis pengetahuan Anda.
   + Tambahkan tag ke basis pengetahuan Anda. Untuk informasi selengkapnya, lihat [Menandai sumber daya Amazon Bedrock](tagging.md).

   
1. Pilih **Buat basis pengetahuan**. Sementara Amazon Bedrock menciptakan basis pengetahuan, Anda akan melihat status **Sedang berlangsung**. Anda harus menunggu pembuatan selesai sebelum Anda dapat menambahkan dan menyinkronkan sumber data.

1. Setelah Amazon Bedrock selesai membuat basis pengetahuan, untuk mengonfigurasi sumber data, ikuti petunjuknya. [Connect sumber data ke basis pengetahuan Anda](data-source-connectors.md)

------
#### [ API ]

**Untuk membuat basis pengetahuan dengan indeks Amazon Kendra GenAI**

Untuk membuat basis pengetahuan, kirim [ CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html)permintaan (lihat tautan untuk format permintaan dan respons serta detail bidang) dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt).
+ Di `roleArn` lapangan, berikan Nama Sumber Daya Amazon (ARN) peran IAM yang memiliki izin untuk membuat basis pengetahuan Amazon Bedrock.
+ Untuk menggunakan model yang didukung untuk basis pengetahuan, Anda harus [mengaktifkan akses model](model-access.md). Perhatikan ARN model Anda, yang diperlukan untuk mengonversi data Anda menjadi embeddings vektor. Salin ID model (sumber daya) untuk model yang Anda pilih untuk basis pengetahuan. *Kemudian, buat model ARN menggunakan ID model dengan mengikuti contoh ARN yang disediakan [dalam tipe Resource yang ditentukan oleh Amazon Bedrock dalam Referensi](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-resources-for-iam-policies) Otorisasi Layanan.* Lihat contoh untuk jenis sumber daya model Anda.

  Di `embeddingModelArn` lapangan, di `knowledgeBaseConfiguration` objek, berikan ARN dari model embeddings vektor yang ingin Anda gunakan. Untuk informasi selengkapnya, lihat [Model dan Wilayah yang didukung untuk basis pengetahuan Amazon Bedrock](knowledge-base-supported.md).
+ Untuk membuat basis pengetahuan dengan indeks Amazon Kendra GenAI, berikan ARN indeks Amazon Kendra GenAI Anda 
+ Setelah Anda membuat basis pengetahuan, buat sumber data yang berisi dokumen atau konten untuk basis pengetahuan Anda. Perhatikan bahwa Anda tidak dapat membuat sumber data menggunakan operasi Amazon Bedrock API. Anda harus melakukannya dengan konsol Amazon Bedrock atau operasi Amazon [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html)Kendra API. Untuk informasi selengkapnya tentang memilih sumber data, dan untuk contoh konfigurasi koneksi API, lihat[Connect sumber data ke basis pengetahuan Anda](data-source-connectors.md).

------

# Bangun basis pengetahuan dengan grafik dari Amazon Neptune Analytics
<a name="knowledge-base-build-graphs"></a>

Amazon Bedrock Knowledge Bases menawarkan fitur GraphRag yang dikelola sepenuhnya dengan Amazon Neptunus. GraphRag adalah kemampuan yang disediakan dengan Amazon Bedrock Knowledge Bases yang menggabungkan pemodelan grafik dengan AI generatif untuk meningkatkan retrieval-augmented generation (RAG). Fitur ini menggabungkan pencarian vektor dengan kemampuan untuk dengan cepat menganalisis sejumlah besar data grafik dari Amazon Neptunus dalam aplikasi RAG.

GraphRag secara otomatis mengidentifikasi dan memanfaatkan hubungan antara entitas dan elemen struktural dalam dokumen yang dicerna ke dalam Basis Pengetahuan. Hal ini memungkinkan tanggapan yang lebih komprehensif dan relevan secara kontekstual dari model pondasi, terutama ketika informasi perlu dihubungkan melalui beberapa langkah logis. Ini berarti bahwa aplikasi AI generatif dapat memberikan respons yang lebih relevan dalam kasus di mana menghubungkan data dan penalaran di beberapa potongan dokumen diperlukan. Ini memberdayakan aplikasi seperti chatbots untuk memberikan tanggapan yang lebih relevan dari model dasar (FMs) dalam kasus di mana fakta, entitas, dan hubungan terkait yang berasal dari berbagai sumber dokumen diperlukan untuk menjawab pertanyaan

## Ketersediaan Wilayah GraphRag
<a name="knowledge-base-build-graphs-regions"></a>

GraphRag tersedia sebagai berikut: Wilayah AWS
+ Eropa (Frankfurt)
+ Eropa (London)
+ Eropa (Irlandia)
+ AS Barat (Oregon)
+ AS Timur (Virginia Utara)
+ Asia Pasifik (Tokyo)
+ Asia Pacific (Singapore) (Asia Pacific (Singapore))

## Manfaat menggunakan GraphRag
<a name="knowledge-base-build-graphs-benefits"></a>

Pangkalan Pengetahuan Amazon Bedrock dengan GraphRag menawarkan manfaat berikut:
+ Respons yang lebih relevan dan komprehensif dengan secara otomatis mengidentifikasi dan memanfaatkan hubungan antara entitas dan elemen struktural (seperti judul bagian) di berbagai sumber dokumen yang dicerna ke dalam Pangkalan Pengetahuan Amazon Bedrock.
+ Peningkatan kemampuan untuk melakukan pencarian lengkap yang menghubungkan potongan konten yang berbeda melalui beberapa langkah logis, meningkatkan teknik RAG tradisional.
+ Kemampuan penalaran lintas dokumen yang lebih baik, memungkinkan jawaban yang lebih tepat dan akurat secara kontekstual dengan menghubungkan informasi di berbagai sumber, yang membantu lebih meningkatkan akurasi dan meminimalkan halusinasi.

## Bagaimana GraphRag bekerja
<a name="knowledge-base-build-graphs-works"></a>

Setelah melakukan pencarian vektor awal untuk node yang relevan, Amazon Bedrock Knowledge Bases GraphRag melakukan langkah-langkah berikut untuk menghasilkan respons yang lebih baik:

1. Mengambil node grafik terkait atau pengidentifikasi potongan yang ditautkan ke potongan dokumen yang diambil.

1. Memperluas potongan terkait ini dengan melintasi grafik dan mengambil detailnya dari database grafik.

1. Memberikan tanggapan yang lebih bermakna dengan memahami entitas yang relevan dan berfokus pada koneksi kunci menggunakan konteks yang diperkaya ini.

## Pertimbangan dan batasan GraphRag
<a name="knowledge-base-build-graphs-considerations"></a>

Berikut ini adalah beberapa batasan saat menggunakan Basis Pengetahuan Amazon Bedrock dengan GraphRag
+ Opsi konfigurasi untuk menyesuaikan pembuatan grafik tidak didukung.
+ Penskalaan otomatis tidak didukung untuk grafik Amazon Neptune Analytics.
+ GraphRag hanya mendukung Amazon S3 sebagai sumber data.
+ Claude 3 Haiku dipilih sebagai model dasar untuk secara otomatis membuat grafik untuk basis pengetahuan Anda. Ini secara otomatis memungkinkan pengayaan kontekstual.
+ Setiap sumber data dapat memiliki hingga 1000 file. Anda dapat meminta untuk meningkatkan batas ini hingga maksimum 10000 file per sumber data. Atau, Anda dapat mempartisi bucket Amazon S3 Anda ke dalam folder, di mana setiap folder dapat berisi hingga 1000 file.
+ Jika Anda menggunakan chunking hierarkis sebagai strategi chunking, GraphRag hanya mengambil potongan anak selama operasi pencarian. Itu tidak menggantikan potongan anak dengan potongan induk yang sesuai. Ini berarti hasil penelusuran Anda berisi konten spesifik dan terperinci dari potongan anak, bukan konteks yang lebih luas dari potongan induk.

**catatan**  
Saat menghapus basis pengetahuan yang menggunakan Amazon Neptunus Analytics, hapus basis pengetahuan terlebih dahulu, lalu hapus grafik Amazon Neptunus Analytics. Menghapus basis pengetahuan tidak secara otomatis menghapus grafik yang mendasarinya. Biaya tambahan mungkin timbul sampai Anda menghapus grafik secara eksplisit. Atau, setel kebijakan penghapusan sumber data Anda ke mode RESTAIN untuk menghapus grafik terlebih dahulu tanpa menyebabkan kegagalan. Lihat informasi yang lebih lengkap di [Menghapus sumber data dari basis pengetahuan Amazon Bedrock Anda](kb-ds-delete.md).

# Buat basis pengetahuan Amazon Bedrock dengan grafik Amazon Neptune Analytics
<a name="knowledge-base-build-graphs-build"></a>

GraphRag sepenuhnya terintegrasi ke dalam Pangkalan Pengetahuan Amazon Bedrock dan menggunakan Amazon Neptune Analytics untuk penyimpanan grafik dan vektor. Anda dapat mulai menggunakan GraphRag di basis pengetahuan Anda dengan Konsol Manajemen AWS, the AWS CLI, atau SDK AWS .

Anda tidak memerlukan infrastruktur grafik yang ada untuk mulai menggunakan GraphRag. Amazon Bedrock Knowledge Bases secara otomatis mengelola pembuatan dan pemeliharaan grafik dari Amazon Neptunus. Sistem akan secara otomatis membuat dan memperbarui grafik dengan mengekstrak entitas, fakta, dan hubungan dari dokumen yang Anda unggah ke ember Amazon S3 Anda. sehingga Anda dapat memberikan tanggapan yang relevan kepada pengguna akhir Anda, tanpa pengetahuan sebelumnya dalam pemodelan grafik. Grafik akan disimpan di Amazon Neptune Analytics.

Saat Anda membuat basis pengetahuan, Anda mengatur atau menentukan yang berikut ini:
+ Informasi umum yang mendefinisikan dan mengidentifikasi basis pengetahuan.
+ Peran layanan dengan izin ke basis pengetahuan.
+ Konfigurasi untuk basis pengetahuan, termasuk model embeddings yang akan digunakan saat mengonversi data dari sumber data, dan konfigurasi penyimpanan untuk layanan tempat menyimpan embeddings.

**catatan**  
Anda tidak dapat membuat basis pengetahuan dengan pengguna root. Masuk dengan pengguna IAM sebelum memulai langkah-langkah ini.

Berikut ini menunjukkan cara membuat basis pengetahuan untuk menggunakan Neptunus GraphRag dari konsol dan menggunakan CLI.

------
#### [ Console ]

**Untuk membuat basis pengetahuan untuk Neptune Analytics dari konsol**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, pilih **Buat**, lalu pilih **Pangkalan Pengetahuan dengan penyimpanan vektor**.

1. (Opsional) Di bawah **detail Basis Pengetahuan**, ubah nama default dan berikan deskripsi untuk basis pengetahuan Anda.

1. Di bawah **izin IAM**, pilih peran IAM yang menyediakan izin Amazon Bedrock untuk mengakses lainnya yang diperlukan. Layanan AWS Anda dapat meminta Amazon Bedrock membuat peran layanan untuk Anda, atau Anda dapat memilih untuk menggunakan peran kustom Anda sendiri yang telah Anda buat untuk Neptune Analytics. Sebagai contoh, lihat [Izin untuk mengakses database vektor Anda di Amazon Neptune Analytics](kb-permissions.md#kb-permissions-neptune).

1. Pastikan untuk memilih **Amazon S3** sebagai sumber data Anda dan pilih **Berikutnya** untuk mengonfigurasi sumber data Anda.

1. Berikan **URI S3** file yang akan digunakan sebagai sumber data untuk menghubungkan basis pengetahuan Anda ke dan untuk diintegrasikan dengan Amazon Neptune Analytics. Untuk langkah-langkah tambahan dan informasi opsional yang dapat Anda berikan, lihat[Connect sumber data ke basis pengetahuan Anda](data-source-connectors.md).

1. Di bagian **model Embeddings, pilih model** embeddings untuk mengubah data Anda menjadi embeddings vektor. Secara opsional, Anda dapat menggunakan bagian **Konfigurasi tambahan** untuk menentukan dimensi vektor. Untuk jenis embeddings, kami sarankan Anda menggunakan floating-point vector embeddings.
**catatan**  
Dimensi vektor model embeddings harus sesuai dengan dimensi vektor yang Anda tentukan saat membuat grafik Neptunus Analytics.

1. Di bagian **database Vector**, pilih metode untuk membuat penyimpanan vektor, lalu pilih **Amazon Neptune Analytics (GraphRag**) sebagai penyimpanan vektor Anda untuk menyimpan embeddings yang akan digunakan untuk kueri. Untuk membuat penyimpanan vektor, Anda dapat menggunakan salah satu metode berikut:
   + Kami menyarankan Anda menggunakan metode **Quick create a new vector store** untuk memulai dengan cepat dengan membuat penyimpanan vektor Anda. Pilih **Amazon Neptune Analytics (GraphRag**) sebagai penyimpanan vektor Anda. Opsi ini tidak mengharuskan Anda memiliki sumber daya Neptunus Analytics yang ada. Basis pengetahuan secara otomatis menghasilkan dan menyimpan penyematan dokumen di Amazon Neptunus, bersama dengan representasi grafik entitas dan hubungannya yang berasal dari korpus dokumen.
   + Atau, jika Anda telah membuat grafik Neptunus Analytics dan indeks vektor, Anda dapat menggunakan opsi **Pilih penyimpanan vektor yang telah Anda** buat. Pilih **Amazon Neptune Analytics (GraphRag**) sebagai penyimpanan vektor Anda, dan identifikasi grafik ARN, nama bidang vektor, dan nama bidang metadata dalam indeks vektor. Untuk informasi selengkapnya, lihat [Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan](knowledge-base-setup.md).

1. Pilih **Berikutnya** dan tinjau detail basis pengetahuan Anda. Anda dapat mengedit bagian apa pun sebelum melanjutkan dan membuat basis pengetahuan Anda.
**catatan**  
Waktu yang dibutuhkan untuk membuat basis pengetahuan tergantung pada konfigurasi spesifik Anda. Ketika pembuatan basis pengetahuan telah selesai, status basis pengetahuan berubah menjadi keadaan siap atau tersedia.  
Setelah basis pengetahuan Anda siap dan tersedia, sinkronkan sumber data Anda untuk pertama kalinya dan kapan pun Anda ingin memperbarui konten Anda. Pilih basis pengetahuan Anda di konsol dan pilih **Sinkronkan** dalam bagian ikhtisar sumber data.

1. Pilih **Buat basis pengetahuan**. Sementara Amazon Bedrock menciptakan basis pengetahuan, Anda akan melihat status **Sedang berlangsung**. Anda harus menunggu pembuatan selesai sebelum Anda dapat menyinkronkan sumber data.

1. Setelah Amazon Bedrock selesai membuat basis pengetahuan, untuk mengonfigurasi sumber data, ikuti petunjuknya. [Connect sumber data ke basis pengetahuan Anda](data-source-connectors.md)

------
#### [ API ]

**Untuk membuat basis pengetahuan untuk Neptunus Analytics menggunakan AWS CLI**

1. Pertama buat sumber data menggunakan konfigurasi pengayaan konteks. Untuk melakukan operasi ini, kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock.](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) Berikut ini menunjukkan contoh perintah CLI.

   ```
   aws bedrock-agent create-data-source \
       --name graph_rag_source \
       --description data_source_for_graph_rag \
       --knowledge-base-id LDBBY2K5AG \
       --cli-input-json "file://input.json"
   ```

   Kode berikut menunjukkan isi `input.json` file.

   ```
   {
       "dataSourceConfiguration": { 
           "s3Configuration": { 
               "bucketArn": "arn:aws:s3:::<example-graphrag-datasets>",
               "bucketOwnerAccountId": "<ABCDEFGHIJ>",
               "inclusionPrefixes": [ <"example-dataset"> ]
           },
           "type": "S3",
       },
       "VectorIngestionConfiguration": {
           "contextEnrichmentConfiguration":
               "type": "BEDROCK_FOUNDATION_MODEL",
               "bedrockFoundationModelConfiguration": {
                   "modelArn": "arn:aws:bedrock:<region>::foundation-model/anthropic.claude-3-haiku-20240307-v1:0",
                   "enrichmentStrategyConfiguration": {
                       "method": "CHUNK_ENTITY_EXTRACTION"
               }
           }
       }
   }
   ```

   Untuk yang `modelArn` digunakan untuk membuat grafik dari dokumen Anda, Anda dapat menggunakan Claude 3 Haiku (seperti yang ditunjukkan pada contoh sebelumnya), Claude Haiku 4.5, dan keluarga Amazon Nova (termasuk model Nova 2 dan Nova dengan modalitas input teks). Untuk melihat model foundation yang tersedia di Wilayah Anda, lihat [Model foundation yang didukung di Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/models-supported.html).
**catatan**  
Beberapa model hanya didukung melalui profil inferensi lintas wilayah. Saat Anda memanggil profil inferensi lintas wilayah di Amazon Bedrock, permintaan dan data yang akan dicerna berasal dari Wilayah sumber dan secara otomatis dirutekan ke salah satu Wilayah tujuan yang ditentukan dalam profil tersebut, mengoptimalkan kinerja. Wilayah tujuan untuk profil inferensi Lintas Wilayah Global mencakup semua Wilayah komersial. Misalnya, Anda dapat menentukan panggilan Lintas wilayah berbasis AS dari Wilayah us-west-2 menggunakan format tersebut. `modelArn` `arn:aws:bedrock:us-west-2:account-id:inference-profile/us.anthropic.claude-haiku-4-5-20251001-v1:0`

   Untuk melihat persyaratan kebijakan agar peran Anda menggunakan profil inferensi, lihat [Prasyarat](https://docs.aws.amazon.com/bedrock/latest/userguide/inference-profiles-prereq.html) untuk profil inferensi lintas wilayah. Untuk panduan tentang cara menggunakan profil inferensi untuk memilih Wilayah sumber dan tujuan, lihat [Wilayah dan model yang Didukung untuk profil inferensi](https://docs.aws.amazon.com/bedrock/latest/userguide/inference-profiles-support.html). Data Anda hanya disimpan di Wilayah sumber yang sesuai dengan basis pengetahuan Amazon Bedrock dan instans Amazon Neptunus Analytics. Wilayah tujuan hanya digunakan untuk inferensi.

1. Untuk membuat basis pengetahuan, kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Berikut ini menunjukkan contoh perintah CLI.

   ```
   aws bi create-knowledge-base \
   --name <"knowledge-base-graphrag"> \
   --role-arn arn:aws:iam::<accountId>:role/<BedrockExecutionRoleForKnowledgeBase> \
   --cli-input-json "file://input.json"
   ```

   Berikut ini menunjukkan isi file `input.json`.

   ```
   {
       "storageConfiguration": {
           "type": "NEPTUNE_ANALYTICS"
           "neptuneAnalyticsConfiguration": {
               "graphArn": "arn:aws:neptune-graph:<region>:<>:graph/<graphID>",
               "fieldMapping": {
                   "metadataField": "metadata",
                   "textField": "text"
               },
           }
       },
       "knowledgeBaseConfiguration": {
           "type": "VECTOR",
           "vectorKnowledgeBaseConfiguration": {
               "embeddingModelArn": "arn:aws:bedrock:<region>::foundation-model/cohere.embed-english-v3"
           }
       }
   }
   ```

1. Saat aplikasi berbasis GraphRag berjalan, Anda dapat terus menggunakan operasi Knowledge Bases API untuk memberikan tanggapan yang lebih komprehensif, relevan, dan dapat dijelaskan kepada pengguna akhir. Bagian berikut menunjukkan cara memulai konsumsi dan melakukan kueri pengambilan menggunakan perintah CLI.

------

## Sinkronkan sumber data Anda
<a name="knowledge-base-build-graphs-sync"></a>

Setelah Anda membuat basis pengetahuan Anda, Anda menelan atau menyinkronkan data Anda sehingga data dapat ditanyakan. Ingestion mengekstrak struktur grafis dan mengubah data mentah dalam sumber data Anda menjadi embeddings vektor, berdasarkan model penyematan vektor dan konfigurasi yang Anda tentukan.

Perintah berikut menunjukkan contoh bagaimana memulai pekerjaan konsumsi menggunakan CLI.

```
aws bedrock-agent start-ingestion-job \
--data-source-id <"ABCDEFGHIJ"> \
--knowledge-base-id <"EFGHIJKLMN">
```

Untuk informasi selengkapnya dan cara menyinkronkan sumber data menggunakan konsol dan API, lihat[Sinkronkan data Anda dengan basis pengetahuan Amazon Bedrock Anda](kb-data-source-sync-ingest.md).

## Menelan perubahan ke dalam basis pengetahuan Anda
<a name="knowledge-base-build-graphs-ingest"></a>

Saat menggunakan Amazon S3 sebagai sumber data, Anda dapat memodifikasi sumber data dan menyinkronkan perubahan dalam satu langkah. Dengan konsumsi langsung, Anda dapat langsung menambahkan, memperbarui, atau menghapus file dalam basis pengetahuan dalam satu tindakan dan basis pengetahuan Anda dapat memiliki akses ke dokumen tanpa perlu menyinkronkan. Direct ingestion menggunakan operasi `KnowledgeBaseDocuments` API untuk mengindeks dokumen yang Anda kirimkan langsung ke penyimpanan vektor yang disiapkan untuk basis pengetahuan. Anda juga dapat melihat dokumen di basis pengetahuan Anda secara langsung dengan operasi ini, daripada perlu menavigasi ke sumber data yang terhubung untuk melihatnya. Untuk informasi selengkapnya, lihat [Ingest berubah langsung menjadi basis pengetahuan](kb-direct-ingestion.md).

## Uji basis pengetahuan Anda
<a name="knowledge-base-build-graphs-test"></a>

Sekarang setelah Anda menyiapkan basis pengetahuan Anda, Anda dapat mengujinya dengan mengirimkan kueri dan menghasilkan tanggapan.

Kode berikut menunjukkan contoh perintah CLI.

```
aws bedrock-agent-runtime retrieve \
--knowledge-base-id <"ABCDEFGHIJ"> \
--retrieval-query="{\"text\": \"What are the top three video games available now?\"}"
```

Lihat informasi yang lebih lengkap di [Kueri basis pengetahuan yang terhubung ke grafik Amazon Neptunus Analytics](kb-test-neptune.md).

# Uji basis pengetahuan Anda dengan pertanyaan dan tanggapan
<a name="knowledge-base-test"></a>

Setelah Anda mengatur basis pengetahuan Anda, Anda dapat menguji perilakunya dengan cara berikut:
+ Kirim kueri dan ambil informasi yang relevan dari sumber data Anda, dengan menggunakan operasi. [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)
+ Kirim kueri dan hasilkan tanggapan terhadap kueri berdasarkan informasi yang diambil dari sumber data Anda, dengan menggunakan operasi. [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)
+ Gunakan model reranking di atas model reranking Basis Pengetahuan Amazon Bedrock default untuk mengambil sumber yang lebih relevan saat menggunakan salah satu atau. [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)
+ Gunakan filter metadata opsional dengan `RetrieveAndGenerate` API `Retrieve` atau untuk menentukan dokumen mana dalam sumber data Anda yang dapat digunakan.

Ketika Anda puas dengan perilaku basis pengetahuan Anda, Anda kemudian dapat mengatur aplikasi Anda untuk menanyakan basis pengetahuan atau melampirkan basis pengetahuan ke agen dengan melanjutkan ke[Terapkan basis pengetahuan Anda untuk aplikasi AI Anda](knowledge-base-deploy.md).

Pilih topik untuk mempelajari lebih lanjut tentang hal itu.

**Topics**
+ [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md)
+ [Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md)
+ [Menghasilkan kueri untuk data terstruktur](knowledge-base-generate-query.md)
+ [Kueri basis pengetahuan yang terhubung ke indeks Amazon Kendra GenAI](kb-test-kendra.md)
+ [Kueri basis pengetahuan yang terhubung ke grafik Amazon Neptunus Analytics](kb-test-neptune.md)
+ [Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md)
+ [Konfigurasikan pembuatan respons untuk model penalaran dengan Basis Pengetahuan](kb-test-configure-reasoning.md)

# Kueri basis pengetahuan dan ambil data
<a name="kb-test-retrieve"></a>

**penting**  
Guardrails diterapkan hanya untuk input dan respon yang dihasilkan dari LLM. Mereka tidak diterapkan pada referensi yang diambil dari Pangkalan Pengetahuan saat runtime.

Setelah basis pengetahuan Anda disiapkan, Anda dapat melakukan kueri dan mengambil potongan dari data sumber yang relevan dengan kueri menggunakan operasi API. [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html) Anda juga dapat [menggunakan model reranking](rerank.md) alih-alih ranker Amazon Bedrock Knowledge Bases default untuk memberi peringkat potongan sumber untuk relevansi selama pengambilan.

Untuk mempelajari cara menanyakan basis pengetahuan Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk menguji basis pengetahuan Anda**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, lakukan salah satu tindakan berikut:
   + Pilih tombol radio di sebelah basis pengetahuan yang ingin Anda uji dan pilih **Uji basis pengetahuan**. Jendela uji mengembang dari kanan.
   + Pilih basis pengetahuan yang ingin Anda uji. Jendela uji mengembang dari kanan.

1. Di jendela pengujian, hapus **Hasilkan respons untuk kueri Anda** untuk mengembalikan informasi yang diambil langsung dari basis pengetahuan Anda.

1. (Opsional) Pilih ikon konfigurasi (![\[Three horizontal sliders with adjustable circular controls for settings or parameters.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/configurations.png)) untuk membuka **Konfigurasi**. Untuk informasi tentang konfigurasi, lihat[Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md).

1. Masukkan kueri di kotak teks di jendela obrolan dan pilih **Jalankan** untuk mengembalikan respons dari basis pengetahuan.

1. Potongan sumber dikembalikan secara langsung sesuai urutan relevansi.  Gambar yang diekstrak dari sumber data Anda juga dapat dikembalikan sebagai potongan sumber.

1. Untuk melihat detail tentang potongan yang dikembalikan, pilih **Tampilkan detail sumber**.
   + Untuk melihat konfigurasi yang Anda tetapkan untuk kueri, perluas **konfigurasi Kueri**.
   + Untuk melihat detail tentang potongan sumber, perluas dengan memilih panah kanan (![\[Play button icon with a triangular shape pointing to the right.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/caret-right-filled.png)) di sebelahnya. Anda dapat melihat informasi berikut:
     + Teks mentah dari potongan sumber. Untuk menyalin teks ini, pilih ikon salin (![\[Icon representing a crop or resize function, with two overlapping rectangles.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/copy.png)). Jika Anda menggunakan Amazon S3 untuk menyimpan data Anda, pilih ikon tautan eksternal (![\[Icon of a square with an arrow pointing outward from its top-right corner.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/external.png)) untuk menavigasi ke objek S3 yang berisi file.
     + Metadata yang terkait dengan potongan sumber, jika Anda menggunakan Amazon S3 untuk menyimpan data Anda. attribute/field Kunci dan nilai didefinisikan dalam `.metadata.json` file yang terkait dengan dokumen sumber. Untuk informasi selengkapnya, lihat bagian **Metadata dan pemfilteran** di. [Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md)

**Opsi obrolan**
+ **Beralih ke menghasilkan respons berdasarkan potongan sumber yang diambil dengan mengaktifkan Hasilkan respons.** Jika Anda mengubah pengaturan, teks di jendela obrolan akan sepenuhnya dihapus.
+ Untuk menghapus jendela obrolan, pilih ikon sapu (![\[Magnifying glass icon with a checkmark inside, symbolizing search or inspection.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/broom.png)).
+ Untuk menyalin semua output di jendela obrolan, pilih ikon salin (![\[Icon representing a crop or resize function, with two overlapping rectangles.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/copy.png)).

------
#### [ API ]

Untuk menanyakan basis pengetahuan dan hanya mengembalikan teks yang relevan dari sumber data, kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)permintaan dengan titik akhir [waktu proses Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-rt).

Bidang berikut diperlukan:


****  

| Bidang | Deskripsi dasar | 
| --- | --- | 
| knowledgeBaseId | Untuk menentukan basis pengetahuan untuk query. | 
| RetrievalQuery | Berisi text bidang untuk menentukan kueri. | 
| GuardrailsConfiguration | Sertakan bidang GuardrailsConfiguration seperti guardrailsId dan guardrailsVersion untuk menggunakan pagar pembatas Anda dengan permintaan | 

Bidang berikut adalah opsional:


****  

| Bidang | Kasus penggunaan | 
| --- | --- | 
| nextToken | Untuk mengembalikan kumpulan tanggapan berikutnya (lihat bidang respons di bawah). | 
| RetrievalConfiguration | Untuk menyertakan [konfigurasi kueri](kb-test-config.md) untuk menyesuaikan pencarian vektor. Untuk informasi selengkapnya, lihat [KnowledgeBaseVectorSearchConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseVectorSearchConfiguration.html). | 

Anda dapat menggunakan model reranking di atas model peringkat Basis Pengetahuan Amazon Bedrock default dengan menyertakan `rerankingConfiguration` bidang dalam. [KnowledgeBaseVectorSearchConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseVectorSearchConfiguration.html) `rerankingConfiguration`Bidang memetakan ke [VectorSearchRerankingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_VectorSearchRerankingConfiguration.html)objek, di mana Anda dapat menentukan model reranking yang akan digunakan, bidang permintaan tambahan apa pun yang akan disertakan, atribut metadata untuk memfilter dokumen selama penanking ulang, dan jumlah hasil yang akan dikembalikan setelah pencatatan ulang. Untuk informasi selengkapnya, lihat [VectorSearchRerankingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_VectorSearchRerankingConfiguration.html).

**catatan**  
Jika Anda `numberOfRerankedResults` nilai yang Anda tentukan lebih besar dari `numberOfResults` nilai dalam [KnowledgeBaseVectorSearchConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseVectorSearchConfiguration.html), jumlah maksimum hasil yang akan dikembalikan adalah nilai untuk`numberOfResults`. Pengecualian adalah jika Anda menggunakan dekomposisi kueri (untuk informasi selengkapnya, lihat bagian **modifikasi kueri** di[Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md). Jika Anda menggunakan dekomposisi kueri, `numberOfRerankedResults` bisa sampai lima kali. `numberOfResults`

Respons mengembalikan potongan sumber dari sumber data sebagai array [KnowledgeBaseRetrievalResult](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalResult.html)objek di lapangan. `retrievalResults` Masing-masing [KnowledgeBaseRetrievalResult](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalResult.html)berisi bidang-bidang berikut:


****  

| Bidang | Deskripsi | 
| --- | --- | 
| content | Berisi potongan sumber teks di text atau potongan sumber gambar di bidang. byteContent  Jika konten adalah gambar, URI data dari konten yang disandikan base64 dikembalikan dalam format berikut:. data:image/jpeg;base64,\$1\$1base64-encoded string\$1 | 
| Metadata | Berisi setiap atribut metadata sebagai kunci dan nilai metadata sebagai nilai JSON yang dipetakan kunci. | 
| lokasi | Berisi URI atau URL dokumen yang dimiliki potongan sumber. | 
| skor | Skor relevansi dokumen. Anda dapat menggunakan skor ini untuk menganalisis peringkat hasil. | 

Jika jumlah potongan sumber melebihi apa yang bisa muat dalam respons, nilai dikembalikan di `nextToken` bidang. Gunakan nilai itu dalam permintaan lain untuk mengembalikan kumpulan hasil berikutnya.

Jika data yang diambil berisi gambar, respons juga mengembalikan header respons berikut, yang berisi metadata untuk potongan sumber yang dikembalikan dalam respons:
+ `x-amz-bedrock-kb-byte-content-source`— Berisi URI Amazon S3 dari gambar.
+ `x-amz-bedrock-kb-description`— Berisi string yang dikodekan base64 untuk gambar.

**catatan**  
Anda tidak dapat memfilter header respons metadata ini saat [mengonfigurasi](kb-test-config.md) filter metadata.

**Kueri multimodal**  
Untuk basis pengetahuan yang menggunakan model penyematan multimodal, Anda dapat melakukan kueri dengan teks atau gambar. `retrievalQuery`Bidang ini mendukung `multimodalInputList` bidang untuk kueri gambar:

**catatan**  
Untuk panduan komprehensif tentang pengaturan dan bekerja dengan basis pengetahuan multimodal, termasuk memilih antara pendekatan Nova dan BDA, lihat. [Membangun basis pengetahuan untuk konten multimodal](kb-multimodal.md)

Anda dapat melakukan kueri dengan gambar dengan menggunakan `multimodalInputList` bidang:

```
{
    "knowledgeBaseId": "EXAMPLE123", 
    "retrievalQuery": {
        "multimodalInputList": [
            {
                "content": {
                    "byteContent": "base64-encoded-image-data"
                },
                "modality": "IMAGE"
            }
        ]
    }
}
```

Atau Anda dapat menanyakan dengan teks hanya dengan menggunakan `text` bidang:

```
{
    "knowledgeBaseId": "EXAMPLE123",
    "retrievalQuery": {
        "text": "Find similar shoes"
    }
}
```

**Pola kueri multimodal umum**  
Berikut ini adalah beberapa pola query umum:

Image-to-image pencarian  
Unggah gambar untuk menemukan gambar yang mirip secara visual. Contoh: Unggah foto sepatu Nike merah untuk menemukan sepatu serupa di katalog produk Anda.

Pencarian berbasis teks  
Gunakan kueri teks untuk menemukan konten yang relevan. Contoh: “Temukan sepatu serupa” untuk mencari katalog produk Anda menggunakan deskripsi teks.

Pencarian dokumen visual  
Cari bagan, diagram, atau elemen visual dalam dokumen. Contoh: Unggah gambar bagan untuk menemukan bagan serupa di koleksi dokumen Anda.

**Memilih antara Nova dan BDA untuk konten multimodal**  
Saat bekerja dengan konten multimodal, pilih pendekatan Anda berdasarkan jenis konten dan pola kueri Anda:


**Matriks Keputusan Nova vs BDA**  

| Jenis Konten | Gunakan Embeddings Nova Multimodal | Gunakan Parser Otomasi Data Batuan Dasar (BDA) | 
| --- | --- | --- | 
| Konten Video | Fokus mendongeng visual (olahraga, iklan, demonstrasi), pertanyaan tentang elemen visual, konten ucapan minimal | Penting speech/narration (presentasi, rapat, tutorial), pertanyaan tentang konten lisan, perlu transkrip | 
| Konten Audio | Identifikasi musik atau efek suara, analisis audio non-ucapan | Podcast, wawancara, rapat, konten apa pun dengan pidato yang membutuhkan transkripsi | 
| Konten Gambar | Pencarian kesamaan visual, image-to-image pengambilan, analisis konten visual | Ekstraksi teks dari gambar, pemrosesan dokumen, persyaratan OCR | 

**catatan**  
Penyematan multimodal Nova tidak dapat memproses konten ucapan secara langsung. Jika file audio atau video Anda berisi informasi lisan yang penting, gunakan parser BDA untuk mengonversi ucapan menjadi teks terlebih dahulu, atau pilih model penyematan teks sebagai gantinya.

**Keterbatasan kueri multimodal**  
Berikut ini adalah beberapa batasan dengan kueri multimodal:
+ Maksimum satu gambar per kueri dalam rilis saat ini
+ Kueri gambar hanya didukung dengan model penyematan multimodal (Titan G1 atau Cohere Embed v3)
+ RetrieveAndGenerate API tidak didukung untuk basis pengetahuan dengan model penyematan multimodal dan bucket konten S3
+ Jika Anda memberikan kueri gambar ke basis pengetahuan menggunakan model penyematan khusus teks, kesalahan 4xx akan dikembalikan

**Struktur respons API multimodal**  
Respons pengambilan untuk konten multimodal mencakup metadata tambahan:
+ **URI Sumber:** Menunjuk ke lokasi bucket S3 asli Anda
+ **URI Tambahan:** Menunjuk ke salinan di bucket penyimpanan multimodal Anda
+ **Metadata stempel waktu:** Termasuk untuk potongan video dan audio untuk memungkinkan pemosisian pemutaran yang tepat

**catatan**  
Saat menggunakan API atau SDK, Anda harus menangani pengambilan file dan navigasi stempel waktu di aplikasi Anda. Konsol menangani ini secara otomatis dengan pemutaran video yang disempurnakan dan navigasi stempel waktu otomatis.

------

**catatan**  
Jika Anda menerima kesalahan bahwa prompt melebihi batas karakter saat menghasilkan respons, Anda dapat mempersingkat prompt dengan cara berikut:  
Kurangi jumlah maksimum hasil yang diambil (ini mempersingkat apa yang diisi untuk placeholder \$1search\$1results\$1 di). [Templat prompt basis pengetahuan: orkestrasi & pembuatan](kb-test-config.md#kb-test-config-prompt-template)
Buat ulang sumber data dengan strategi chunking yang menggunakan potongan yang lebih kecil (ini mempersingkat apa yang diisi untuk placeholder \$1search\$1results\$1 di). [Templat prompt basis pengetahuan: orkestrasi & pembuatan](kb-test-config.md#kb-test-config-prompt-template)
Persingkat template prompt.
Persingkat kueri pengguna (ini mempersingkat apa yang diisi untuk placeholder \$1query\$1 di). [Templat prompt basis pengetahuan: orkestrasi & pembuatan](kb-test-config.md#kb-test-config-prompt-template)

# Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil
<a name="kb-test-retrieve-generate"></a>

**penting**  
Guardrails diterapkan hanya untuk input dan respon yang dihasilkan dari LLM. Mereka tidak diterapkan pada referensi yang diambil dari Pangkalan Pengetahuan saat runtime.

Setelah basis pengetahuan Anda disiapkan, Anda dapat melakukan kueri dan menghasilkan respons berdasarkan potongan yang diambil dari data sumber Anda dengan menggunakan operasi API. [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html) Tanggapan dikembalikan dengan kutipan ke data sumber asli. Anda juga dapat [menggunakan model reranking](rerank.md) alih-alih ranker Amazon Bedrock Knowledge Bases default untuk memberi peringkat potongan sumber untuk relevansi selama pengambilan.

**Batasan konten multimodal**  
`RetrieveAndGenerate`memiliki dukungan terbatas untuk konten multimodal. Saat menggunakan Nova Multimodal Embeddings, fungsionalitas RAG dibatasi hanya untuk konten teks. Untuk dukungan multimodal penuh termasuk pemrosesan audio dan video, gunakan BDA dengan model penyematan teks. Lihat perinciannya di [Membangun basis pengetahuan untuk konten multimodal](kb-multimodal.md).

**catatan**  
Gambar yang dikembalikan dari `Retrieve` respons selama `RetrieveAndGenerate` aliran disertakan dalam prompt untuk pembuatan respons. `RetrieveAndGenerate`Respons tidak dapat menyertakan gambar, tetapi dapat mengutip sumber yang berisi gambar.

Untuk mempelajari cara menanyakan basis pengetahuan Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk menguji basis pengetahuan Anda**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Di bagian **Basis pengetahuan**, lakukan salah satu tindakan berikut:
   + Pilih tombol radio di sebelah basis pengetahuan yang ingin Anda uji dan pilih **Uji basis pengetahuan**. Jendela uji mengembang dari kanan.
   + Pilih basis pengetahuan yang ingin Anda uji. Jendela uji mengembang dari kanan.

1. Untuk menghasilkan tanggapan berdasarkan informasi yang diambil dari basis pengetahuan Anda, aktifkan **Hasilkan tanggapan untuk kueri Anda**. Amazon Bedrock akan menghasilkan tanggapan berdasarkan sumber data Anda dan mengutip informasi yang diberikannya dengan catatan kaki.

1. Untuk memilih model yang akan digunakan untuk menghasilkan respons, pilih **Pilih model**. Kemudian pilih **Terapkan**. 

1. (Opsional) Pilih ikon konfigurasi (![\[Three horizontal sliders with adjustable circular controls for settings or parameters.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/configurations.png)) untuk membuka **Konfigurasi**. Untuk informasi tentang konfigurasi, lihat[Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md).

1. Masukkan kueri di kotak teks di jendela obrolan dan pilih **Jalankan** untuk mengembalikan respons dari basis pengetahuan.

1. Pilih catatan kaki untuk melihat kutipan dari sumber yang dikutip untuk bagian respons tersebut. Pilih tautan untuk menavigasi ke objek S3 yang berisi file.

1. Untuk melihat detail tentang potongan yang dikembalikan, pilih **Tampilkan detail sumber**.
   + Untuk melihat konfigurasi yang Anda tetapkan untuk kueri, perluas **konfigurasi Kueri**.
   + Untuk melihat detail tentang potongan sumber, perluas dengan memilih panah kanan (![\[Play button icon with a triangular shape pointing to the right.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/caret-right-filled.png)) di sebelahnya. Anda dapat melihat informasi berikut:
     + Teks mentah dari potongan sumber. Untuk menyalin teks ini, pilih ikon salin (![\[Icon representing a crop or resize function, with two overlapping rectangles.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/copy.png)). Jika Anda menggunakan Amazon S3 untuk menyimpan data Anda, pilih ikon tautan eksternal (![\[Icon of a square with an arrow pointing outward from its top-right corner.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/external.png)) untuk menavigasi ke objek S3 yang berisi file.
     + Metadata yang terkait dengan potongan sumber, jika Anda menggunakan Amazon S3 untuk menyimpan data Anda. attribute/field Kunci dan nilai didefinisikan dalam `.metadata.json` file yang terkait dengan dokumen sumber. Untuk informasi selengkapnya, lihat bagian **Metadata dan pemfilteran** di. [Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md)

**Opsi obrolan**
+ Untuk menggunakan model yang berbeda untuk menghasilkan respons, Pilih **Ubah model**. Jika Anda mengubah model, teks di jendela obrolan akan sepenuhnya dihapus.
+ **Beralih ke mengambil potongan sumber secara langsung dengan membersihkan Hasilkan respons.** Jika Anda mengubah pengaturan, teks di jendela obrolan akan sepenuhnya dihapus.
+ Untuk menghapus jendela obrolan, pilih ikon sapu (![\[Magnifying glass icon with a checkmark inside, symbolizing search or inspection.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/broom.png)).
+ Untuk menyalin semua output di jendela obrolan, pilih ikon salin (![\[Icon representing a crop or resize function, with two overlapping rectangles.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/copy.png)).

------
#### [ API ]

Untuk menanyakan basis pengetahuan dan menggunakan model dasar untuk menghasilkan respons berdasarkan hasil dari sumber data, kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)permintaan dengan titik akhir [waktu proses Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-rt).

[https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateStream.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateStream.html)API mengembalikan data dalam format streaming dan memungkinkan Anda mengakses respons yang dihasilkan dalam potongan tanpa menunggu seluruh hasilnya.

Bidang berikut diperlukan:

**catatan**  
Respons API berisi peristiwa kutipan. `citation`Anggota sudah tidak digunakan lagi. Kami menyarankan Anda menggunakan `retrievedReferences` bidang `generatedResponse` dan sebagai gantinya. Untuk referensi, lihat [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_CitationEvent.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_CitationEvent.html).


****  

| Bidang | Deskripsi dasar | 
| --- | --- | 
| input | Berisi text bidang untuk menentukan kueri. | 
| retrieveAndGenerateKonfigurasi | Berisi [RetrieveAndGenerateConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateConfiguration.html), yang menentukan konfigurasi untuk pengambilan dan pembuatan. Lihat di bawah untuk lebih jelasnya. | 

Bidang berikut adalah opsional:


****  

| Bidang | Kasus penggunaan | 
| --- | --- | 
| sessionId | Gunakan nilai yang sama dengan sesi sebelumnya untuk melanjutkan sesi itu dan mempertahankan konteksnya untuk model. | 
| SessionConfiguration | Untuk menyertakan kunci KMS kustom untuk enkripsi sesi. | 

Sertakan `knowledgeBaseConfiguration` bidang di [RetrieveAndGenerateConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateConfiguration.html). Bidang ini memetakan ke [KnowledgeBaseRetrieveAndGenerateConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrieveAndGenerateConfiguration.html)objek, yang berisi bidang-bidang berikut:
+ Bidang berikut diperlukan:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/kb-test-retrieve-generate.html)
+ Bidang berikut adalah opsional:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/kb-test-retrieve-generate.html)

Anda dapat menggunakan model reranking di atas model peringkat Basis Pengetahuan Amazon Bedrock default dengan menyertakan `rerankingConfiguration` bidang di [KnowledgeBaseVectorSearchConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseVectorSearchConfiguration.html)dalam. [KnowledgeBaseRetrievalConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalConfiguration.html) `rerankingConfiguration`Bidang memetakan ke [VectorSearchRerankingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_VectorSearchRerankingConfiguration.html)objek, di mana Anda dapat menentukan model reranking yang akan digunakan, bidang permintaan tambahan apa pun yang akan disertakan, atribut metadata untuk memfilter dokumen selama penanking ulang, dan jumlah hasil yang akan dikembalikan setelah pencatatan ulang. Untuk informasi selengkapnya, lihat [VectorSearchRerankingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_VectorSearchRerankingConfiguration.html).

**catatan**  
Jika Anda `numberOfRerankedResults` nilai yang Anda tentukan lebih besar dari `numberOfResults` nilai dalam [KnowledgeBaseVectorSearchConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseVectorSearchConfiguration.html), jumlah maksimum hasil yang akan dikembalikan adalah nilai untuk`numberOfResults`. Pengecualian adalah jika Anda menggunakan dekomposisi kueri (untuk informasi selengkapnya, lihat bagian **modifikasi kueri** di[Konfigurasikan dan sesuaikan kueri dan pembuatan respons](kb-test-config.md). Jika Anda menggunakan dekomposisi kueri, `numberOfRerankedResults` bisa sampai lima kali. `numberOfResults`

Respons mengembalikan respons yang dihasilkan di `output` lapangan dan potongan sumber yang dikutip sebagai array di lapangan. `citations` Setiap objek [Citation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Citation.html) berisi bidang-bidang berikut.


****  

| Bidang | Deskripsi dasar | 
| --- | --- | 
| generatedResponsePart | Di textResponsePart lapangan, kutipan text yang berkaitan dengan disertakan. spanBidang menyediakan indeks untuk awal dan akhir bagian output yang memiliki kutipan. | 
| RetrievedReferences | Array [RetrievedReference](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievedReference.html)objek, yang masing-masing berisi potongan sumber, metadata terkait dengan dokumen, dan URI atau URL location dokumen dalam sumber data. content  Jika konten adalah gambar, URI data dari konten yang disandikan base64 dikembalikan dalam format berikut:. data:image/jpeg;base64,\$1\$1base64-encoded string\$1 | 

Respons juga mengembalikan `sessionId` nilai, yang dapat Anda gunakan kembali dalam permintaan lain untuk mempertahankan percakapan yang sama.

Jika Anda memasukkan a `guardrailConfiguration` dalam permintaan, `guardrailAction` bidang memberi tahu Anda apakah konten diblokir atau tidak.

Jika data yang diambil berisi gambar, respons juga mengembalikan header respons berikut, yang berisi metadata untuk potongan sumber yang dikembalikan dalam respons:
+ `x-amz-bedrock-kb-byte-content-source`— Berisi URI Amazon S3 dari gambar.
+ `x-amz-bedrock-kb-description`— Berisi string yang dikodekan base64 untuk gambar.

**catatan**  
Anda tidak dapat memfilter header respons metadata ini saat [mengonfigurasi](kb-test-config.md) filter metadata.

------

**catatan**  
Jika Anda menerima kesalahan bahwa prompt melebihi batas karakter saat menghasilkan respons, Anda dapat mempersingkat prompt dengan cara berikut:  
Kurangi jumlah maksimum hasil yang diambil (ini mempersingkat apa yang diisi untuk placeholder \$1search\$1results\$1 di). [Templat prompt basis pengetahuan: orkestrasi & pembuatan](kb-test-config.md#kb-test-config-prompt-template)
Buat ulang sumber data dengan strategi chunking yang menggunakan potongan yang lebih kecil (ini mempersingkat apa yang diisi untuk placeholder \$1search\$1results\$1 di). [Templat prompt basis pengetahuan: orkestrasi & pembuatan](kb-test-config.md#kb-test-config-prompt-template)
Mempersingkat template prompt.
Persingkat kueri pengguna (ini mempersingkat apa yang diisi untuk placeholder \$1query\$1 di). [Templat prompt basis pengetahuan: orkestrasi & pembuatan](kb-test-config.md#kb-test-config-prompt-template)

# Menghasilkan kueri untuk data terstruktur
<a name="knowledge-base-generate-query"></a>

Saat Anda menghubungkan penyimpanan data terstruktur ke basis pengetahuan Anda, basis pengetahuan Anda dapat menanyainya dengan mengonversi kueri bahasa alami yang disediakan oleh pengguna menjadi kueri SQL, berdasarkan struktur sumber data yang ditanyakan. Saat Anda menggunakan:
+ [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html): Respons mengembalikan hasil eksekusi query SQL.
+ [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html): Respons yang dihasilkan didasarkan pada hasil eksekusi query SQL.
+ [GenerateQuery](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerateQuery.html): Amazon Bedrock Knowledge Bases memisahkan konversi kueri dari proses pengambilan. Anda dapat menggunakan operasi API ini untuk mengubah kueri menjadi SQL.

## Menggunakan API `GenerateQuery` ini
<a name="knowledge-base-generate-query-api"></a>

Anda dapat menggunakan respons dari operasi `GenerateQuery` API dengan tindakan berikutnya `Retrieve` atau `RetrieveAndGenerate` tindakan, atau memasukkannya ke dalam alur kerja lain. `GenerateQuery`memungkinkan Anda untuk secara efisien mengubah kueri menjadi kueri SQL dengan mempertimbangkan struktur sumber data basis pengetahuan Anda.

Untuk mengubah kueri bahasa alami menjadi kueri SQL, kirimkan [GenerateQuery](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerateQuery.html)permintaan dengan titik akhir waktu proses [Agen untuk Amazon Bedrock.](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-rt) `GenerateQuery`Permintaan berisi bidang-bidang berikut:
+ queryGenerationInput — Tentukan `TEXT` sebagai `type` dan sertakan kueri di `text` lapangan.
**catatan**  
Pertanyaan harus ditulis dalam bahasa Inggris.
+ TransformationConfiguration - Tentukan `TEXT_TO_SQL` sebagai. `mode` Di `textToSqlConfiguration` lapangan, tentukan `KNOWLEDGE_BASE` sebagai`type`. Kemudian, tentukan ARN dari basis pengetahuan.

Respons mengembalikan array yang berisi [GeneratedQuery](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GeneratedQuery.html)objek di `queries` lapangan. Objek berisi query SQL untuk query di `sql` lapangan.

## Pertimbangan utama
<a name="knowledge-base-generate-query-considerations"></a>

Berikut ini adalah beberapa pertimbangan utama saat menghasilkan kueri menggunakan data terstruktur.
+ 

**Inferensi lintas wilayah dan pengambilan data terstruktur**  
Pengambilan data terstruktur menggunakan inferensi lintas wilayah untuk memilih yang optimal Wilayah AWS dalam geografi Anda untuk memproses permintaan inferensi Anda. Ini tidak dikenakan biaya tambahan, dan meningkatkan pengalaman pelanggan dengan memaksimalkan sumber daya yang tersedia dan ketersediaan model.

  Permintaan inferensi silang disimpan dalam Wilayah AWS yang merupakan bagian dari geografi tempat data awalnya berada. Data Anda tetap tersimpan di dalam Wilayah sumber tetapi petunjuk input dan hasil keluaran mungkin berpindah ke luar Wilayah ini. Semua data akan dikirimkan dienkripsi melalui jaringan aman Amazon.

  Untuk informasi selengkapnya, lihat [Tingkatkan throughput dengan inferensi lintas wilayah](cross-region-inference.md).
+ 

**Akurasi kueri SQL yang dihasilkan**  
Keakuratan kueri SQL yang dihasilkan dapat bervariasi tergantung pada konteks, skema tabel, dan maksud kueri pengguna. Evaluasi kueri yang dihasilkan untuk memastikan bahwa kueri tersebut sesuai dengan kasus penggunaan Anda sebelum menggunakannya dalam beban kerja Anda.
+ 

**Jumlah hasil yang diambil**  
Keterbatasan berikut berlaku saat menghasilkan respons.
  + Saat menggunakan operasi`InvokeAgent`,`RetrieveAndGenerate`, dan `RetrieveAndGenerateStream` API, hanya 10 hasil yang diambil yang digunakan saat menghasilkan respons.
  + Saat menggunakan `InvokeAgent` API, jika ada lebih dari 10 baris hasil yang diambil, jumlah total baris yang diambil tidak diteruskan ke agen untuk menghasilkan respons. Jika Anda menggunakan `RetrieveAndGenerate` API sebagai gantinya, jumlah baris disertakan dalam prompt untuk menghasilkan respons akhir.
+ 

**`GenerateQuery`Kuota API**  
`GenerateQuery`API memiliki kuota 2 permintaan per detik.

## Berikan izin peran untuk mengakses kueri yang dihasilkan
<a name="knowledge-base-structured-permissions"></a>

Untuk basis pengetahuan Anda yang terhubung ke sumber data terstruktur, jika Anda ingin melakukan beberapa operasi tambahan pada squeries yang dihasilkan, Anda harus memberikan izin untuk melakukan tindakan API. `GenerateQuery` Untuk mengizinkan peran IAM Anda menanyakan basis pengetahuan yang terhubung ke penyimpanan data terstruktur, lampirkan kebijakan berikut ke peran tersebut:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "GetKB",
            "Effect": "Allow",
            "Action": [
                "bedrock:GetKnowledgeBase"
            ],
            "Resource": [
                "arn:aws:bedrock:us-east-1:123456789012:knowledge-base/KnowledgeBaseId"
            ]
        },
        {
            "Sid": "GenerateQueryAccess",
            "Effect": "Allow",
            "Action": [
                "bedrock:GenerateQuery",
                "sqlworkbench:GetSqlRecommendations"
            ],
            "Resource": "*"
        },
        {
            "Sid": "Retrieve",
            "Effect": "Allow",
            "Action": [
                "bedrock:Retrieve"
            ],
            "Resource": [
                "arn:aws:bedrock:us-east-1:123456789012:knowledge-base/KnowledgeBaseId"
            ]
        },
        {
            "Sid": "RetrieveAndGenerate",
            "Effect": "Allow",
            "Action": [
                "bedrock:RetrieveAndGenerate"
            ],
            "Resource": [
                "*"
            ]
        }
    ]
}
```

------

Anda dapat menghapus pernyataan yang tidak Anda butuhkan, tergantung pada kasus penggunaan Anda:
+ `GenerateQuery`Pernyataan `GetKB` dan diperlukan untuk memanggil [GenerateQuery](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerateQuery.html)untuk menghasilkan kueri SQL yang memperhitungkan kueri pengguna akun dan sumber data Anda yang terhubung.
+ `Retrieve`Pernyataan ini diperlukan untuk memanggil [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)untuk mengambil data dari penyimpanan data terstruktur Anda.
+ `RetrieveAndGenerate`Pernyataan ini diperlukan untuk memanggil [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)untuk mengambil data dari penyimpanan data terstruktur Anda dan menghasilkan respons berdasarkan data.

# Kueri basis pengetahuan yang terhubung ke indeks Amazon Kendra GenAI
<a name="kb-test-kendra"></a>

Anda dapat menanyakan basis pengetahuan yang menggunakan indeks Amazon Kendra GenAI, dan hanya mengembalikan teks yang relevan dari sumber data. Untuk kueri ini, kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)permintaan dengan [titik akhir runtime Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-rt), seperti dengan basis pengetahuan standar.

Struktur respons yang dikembalikan dari basis pengetahuan dengan indeks Amazon Kendra GenAI sama dengan standar. [ KnowledgeBaseRetrievalResult](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalResult.html) Namun, tanggapannya juga mencakup beberapa bidang tambahan dari Amazon Kendra.

Tabel berikut menjelaskan bidang dari Amazon Kendra yang mungkin Anda lihat dalam respons yang dikembalikan. Amazon Bedrock mendapatkan bidang ini dari respons Amazon Kendra. Jika respons tersebut tidak berisi bidang ini, maka hasil kueri yang dikembalikan dari Amazon Bedrock juga tidak akan memiliki bidang ini.


| Bidang | Deskripsi | 
| --- | --- | 
|  x-amz-kendra-document-judul  |  Judul dokumen yang dikembalikan.  | 
|  x-amz-kendra-score-kepercayaan  |  Peringkat relatif tentang seberapa relevan respons terhadap kueri. Nilai yang mungkin adalah VERY\$1HIGH, HIGH, MEDIUM, LOW, dan NOT\$1AVAILABLE.  | 
|  x-amz-kendra-passage-id  |  ID dari bagian yang dikembalikan.  | 
|  x-amz-kendra-document-id  |  ID dari dokumen yang dikembalikan.  | 
|  DocumentAttributes  |  Atribut dokumen atau bidang metadata dari Amazon Kendra. Hasil kueri yang dikembalikan dari basis pengetahuan menyimpan ini sebagai pasangan nilai kunci metadata. Anda dapat memfilter hasil dengan pemfilteran metadata dari Amazon Bedrock. Lihat informasi yang lebih lengkap di [DocumentAttribute](https://docs.aws.amazon.com/kendra/latest/APIReference/API_DocumentAttribute.html).  | 

# Kueri basis pengetahuan yang terhubung ke grafik Amazon Neptunus Analytics
<a name="kb-test-neptune"></a>

Anda dapat menanyakan basis pengetahuan yang menggunakan grafik Amazon Neptunus Analytics, dan hanya menampilkan teks yang relevan dari sumber data. Untuk kueri ini, kirim [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)permintaan dengan [titik akhir runtime Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-rt), seperti dengan basis pengetahuan standar. Untuk informasi tentang menanyakan basis pengetahuan dan mengambil data dan menghasilkan tanggapan, lihat:
+  [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) 
+  [Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md) 

Struktur respons yang dikembalikan dari basis pengetahuan dengan grafik Amazon Neptunus Analytics, sama dengan standar. [ KnowledgeBaseRetrievalResult](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalResult.html) Namun, tanggapannya juga mencakup beberapa bidang tambahan dari Amazon Neptunus.

Tabel berikut menjelaskan bidang dari Neptunus Analytics yang mungkin Anda lihat dalam respons yang dikembalikan. Amazon Bedrock mendapatkan bidang ini dari respons Neptunus Analytics. Jika respons tersebut tidak berisi bidang ini, maka hasil kueri yang dikembalikan dari Amazon Bedrock juga tidak akan memiliki bidang ini.


| Bidang | Deskripsi | 
| --- | --- | 
|  x-amz-bedrock-kb-sumber-uri  |  URL Amazon S3 dari dokumen yang dikembalikan.  | 
|  skor  |  Ukuran jarak yang menunjukkan seberapa dekat respons cocok dengan kueri yang disediakan, di mana nilai yang lebih rendah menunjukkan kecocokan yang lebih baik.  | 
|  x-amz-bedrock-kb-data-source-id  |  ID sumber data yang digunakan untuk basis pengetahuan.  | 
|  x-amz-bedrock-kb-potongan-id  |  ID potongan yang digunakan untuk mengambil informasi untuk kueri dan menghasilkan respons.  | 
|  DocumentAttributes  |  Atribut dokumen atau bidang metadata dari Amazon Kendra. Hasil kueri yang dikembalikan dari basis pengetahuan menyimpan ini sebagai pasangan nilai kunci metadata. Anda dapat memfilter hasil dengan pemfilteran metadata dari Amazon Bedrock.  | 

## Menggunakan metadata dan penyaringan
<a name="kb-test-neptune-metadata"></a>

Saat Anda menanyakan basis pengetahuan dan menghasilkan respons, Anda dapat memfilter metadata untuk menemukan dokumen yang lebih relevan. Misalnya, Anda dapat memfilter berdasarkan tanggal publikasi dokumen. Anda dapat menggunakan konsol Amazon Bedrock atau API runtime [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html)untuk tujuan ini, yang dapat menentukan beberapa kondisi filter umum.

Berikut ini adalah beberapa pertimbangan untuk menggunakan `RetrievalFilter` API untuk grafik Neptunus Analytics.
+ `listContains`Filter `startsWith` dan tidak didukung.
+ Varian daftar `stringContains` filter tidak didukung.

Berikut ini menunjukkan contoh:

```
"vectorSearchConfiguration": {
        "numberOfResults": 5,
        "filter": {
            "orAll": [
                {
                    "andAll": [
                        {
                            "equals": {
                                "key": "genre",
                                "value": "entertainment"
                            }
                        },
                        {
                            "greaterThan": {
                                "key": "year",
                                "value": 2018
                            }
                        }
                    ]
                },
                {
                    "andAll": [                        
                        {
                            "startsWith": {
                                "key": "author",
                                "value": "C"
                            }
                        }
                    ]
                }
            ]
        }
    }
}
```

# Konfigurasikan dan sesuaikan kueri dan pembuatan respons
<a name="kb-test-config"></a>

Anda dapat mengonfigurasi dan menyesuaikan pengambilan dan generasi respons, yang lebih meningkatkan relevansi respons. Misalnya, Anda dapat menerapkan filter ke metadata dokumen fields/attributes untuk menggunakan dokumen atau dokumen terbaru yang diperbarui dengan waktu modifikasi terbaru.

**catatan**  
Semua konfigurasi berikut, kecuali untuk **Orkestrasi dan pembuatan, hanya berlaku untuk sumber** data yang tidak terstruktur.

Untuk mempelajari lebih lanjut tentang konfigurasi ini di konsol atau API, pilih dari topik berikut:

## Jumlah potongan sumber
<a name="kb-test-config-number"></a>

Saat Anda menanyakan basis pengetahuan, Amazon Bedrock mengembalikan hingga lima hasil dalam respons secara default. Setiap hasil sesuai dengan potongan sumber.

**catatan**  
Jumlah hasil aktual dalam respons mungkin kurang dari `numberOfResults` nilai yang ditentukan, karena parameter ini menetapkan jumlah hasil maksimum yang akan dikembalikan. Jika Anda telah mengonfigurasi chunking hierarkis untuk strategi chunking Anda, `numberOfResults` parameter akan memetakan ke jumlah potongan anak yang akan diambil oleh basis pengetahuan. Karena potongan anak yang berbagi potongan induk yang sama diganti dengan potongan induk dalam respons akhir, jumlah hasil yang dikembalikan mungkin kurang dari jumlah yang diminta.

Untuk mengubah jumlah hasil maksimum yang akan dikembalikan, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

Ikuti langkah-langkah konsol di [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) atau[Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md). Di panel **Konfigurasi**, perluas bagian **potongan Sumber dan masukkan jumlah maksimum potongan** sumber yang akan dikembalikan.

------
#### [ API ]

Saat Anda membuat [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)atau [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)meminta, sertakan `retrievalConfiguration` bidang, dipetakan ke [KnowledgeBaseRetrievalConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalConfiguration.html)objek. Untuk melihat lokasi bidang ini, lihat badan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)permintaan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)dan permintaan dalam referensi API.

Objek JSON berikut menunjukkan bidang minimal yang diperlukan dalam [KnowledgeBaseRetrievalConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalConfiguration.html)objek untuk mengatur jumlah maksimum hasil untuk kembali:

```
"retrievalConfiguration": {
    "vectorSearchConfiguration": {
        "numberOfResults": number
    }
}
```

Tentukan jumlah maksimum hasil yang diambil (lihat `numberOfResults` bidang [KnowledgeBaseRetrievalConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalConfiguration.html)untuk rentang nilai yang diterima) untuk kembali di `numberOfResults` bidang.

------

## Jenis pencarian
<a name="kb-test-config-search"></a>

Jenis pencarian menentukan bagaimana sumber data dalam basis pengetahuan ditanyakan. Jenis pencarian berikut dimungkinkan:

**catatan**  
Pencarian hibrida hanya didukung untuk penyimpanan vektor Amazon RDS, Amazon OpenSearch Tanpa Server, dan MongoDB yang berisi bidang teks yang dapat difilter. Jika Anda menggunakan penyimpanan vektor yang berbeda atau penyimpanan vektor Anda tidak berisi bidang teks yang dapat difilter, kueri menggunakan pencarian semantik.
+ **Default** — Amazon Bedrock memutuskan strategi pencarian untuk Anda.
+ **Hybrid** — Menggabungkan embeddings vektor pencarian (pencarian semantik) dengan mencari melalui teks mentah.
+ **Semantik** — Hanya mencari embeddings vektor.

Untuk mempelajari cara menentukan jenis pencarian, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

Ikuti langkah-langkah konsol di [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) atau[Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md). Saat Anda membuka panel **Konfigurasi**, perluas bagian **Jenis pencarian**, aktifkan Ganti **pencarian default**, dan pilih opsi.

------
#### [ API ]

Saat Anda membuat [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)atau [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)meminta, sertakan `retrievalConfiguration` bidang, dipetakan ke [KnowledgeBaseRetrievalConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalConfiguration.html)objek. Untuk melihat lokasi bidang ini, lihat badan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)permintaan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)dan permintaan dalam referensi API.

Objek JSON berikut menunjukkan bidang minimal yang diperlukan dalam [KnowledgeBaseRetrievalConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalConfiguration.html)objek untuk mengatur konfigurasi jenis pencarian:

```
"retrievalConfiguration": {
    "vectorSearchConfiguration": {
        "overrideSearchType": "HYBRID | SEMANTIC"
    }
}
```

Tentukan jenis pencarian di `overrideSearchType` bidang. Anda memiliki opsi berikut:
+ Jika Anda tidak menentukan nilai, Amazon Bedrock memutuskan strategi pencarian mana yang paling cocok untuk konfigurasi penyimpanan vektor Anda.
+ **HYBRID** — Amazon Bedrock menanyakan basis pengetahuan menggunakan penyematan vektor dan teks mentah.
+ **SEMANTIK** — Amazon Bedrock menanyakan basis pengetahuan menggunakan penyematan vektornya.

------

## Streaming
<a name="kb-test-config-stream"></a>

------
#### [ Console ]

Ikuti langkah-langkah konsol di[Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md). Saat Anda membuka panel **Konfigurasi**, perluas bagian **preferensi Streaming** dan aktifkan respons **Streaming**.

------
#### [ API ]

Untuk melakukan streaming respons, gunakan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateStream.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateStream.html)API. Untuk detail selengkapnya tentang mengisi kolom, lihat tab **API** di[Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md).

------

## Pemfilteran metadata manual
<a name="kb-test-config-filters"></a>

Anda dapat menerapkan filter ke dokumen fields/attributes untuk membantu Anda lebih meningkatkan relevansi tanggapan. Sumber data Anda dapat menyertakan metadata dokumen attributes/fields untuk difilter dan dapat menentukan bidang mana yang akan disertakan dalam penyematan.

Misalnya, “epoch\$1modification\$1time” mewakili waktu dalam jumlah detik sejak 1 Januari 1970 (UTC) ketika dokumen terakhir diperbarui. *Anda dapat memfilter data terbaru, di mana “epoch\$1modification\$1time” lebih besar dari angka tertentu.* Dokumen-dokumen terbaru ini dapat digunakan untuk kueri.

Untuk menggunakan filter saat menanyakan basis pengetahuan, periksa apakah basis pengetahuan Anda memenuhi persyaratan berikut:
+ Saat mengonfigurasi konektor sumber data Anda, sebagian besar konektor merayapi bidang metadata utama dokumen Anda. Jika Anda menggunakan bucket Amazon S3 sebagai sumber data, bucket harus menyertakan setidaknya satu `fileName.extension.metadata.json` untuk file atau dokumen yang terkait dengannya. Lihat **bidang metadata dokumen** [Konfigurasi koneksi](s3-data-source-connector.md#configuration-s3-connector) untuk informasi selengkapnya tentang mengonfigurasi file metadata.
+ Jika indeks vektor basis pengetahuan Anda ada di penyimpanan vektor Amazon OpenSearch Tanpa Server, periksa apakah indeks vektor dikonfigurasi dengan mesin. `faiss` Jika indeks vektor dikonfigurasi dengan `nmslib` mesin, Anda harus melakukan salah satu hal berikut:
  + [Buat basis pengetahuan baru](knowledge-base-create.md) di konsol dan biarkan Amazon Bedrock secara otomatis membuat indeks vektor di Amazon OpenSearch Tanpa Server untuk Anda.
  + [Buat indeks vektor lain](knowledge-base-setup.md) di toko vektor dan pilih `faiss` sebagai **Mesin**. Kemudian [Buat basis pengetahuan baru](knowledge-base-create.md) dan tentukan indeks vektor baru.
+ Jika basis pengetahuan Anda menggunakan indeks vektor dalam bucket vektor S3, Anda tidak dapat menggunakan `stringContains` filter `startsWith` dan.
+ Jika Anda menambahkan metadata ke indeks vektor yang ada di kluster database Amazon Aurora, sebaiknya berikan nama bidang kolom metadata khusus untuk menyimpan semua metadata Anda dalam satu kolom. Selama [konsumsi data](kb-data-source-sync-ingest.md), kolom ini akan digunakan untuk mengisi semua informasi dalam file metadata Anda dari sumber data Anda. Jika Anda memilih untuk menyediakan bidang ini, Anda harus membuat indeks pada kolom ini.
  + Saat Anda [membuat basis pengetahuan baru](knowledge-base-create.md) di konsol dan membiarkan Amazon Bedrock mengonfigurasi basis data Amazon Aurora Anda, itu akan secara otomatis membuat satu kolom untuk Anda dan mengisinya dengan informasi dari file metadata Anda.
  + Ketika Anda memilih untuk [membuat indeks vektor lain](knowledge-base-setup.md) di penyimpanan vektor, Anda harus memberikan nama bidang metadata kustom untuk menyimpan informasi dari file metadata Anda. Jika Anda tidak memberikan nama bidang ini, Anda harus membuat kolom untuk setiap atribut metadata dalam file Anda dan menentukan tipe data (teks, angka, atau boolean). Misalnya, jika atribut `genre` ada di sumber data Anda, Anda akan menambahkan kolom bernama `genre` dan menentukan `text` sebagai tipe data. Selama konsumsi, kolom terpisah ini akan diisi dengan nilai atribut yang sesuai.

*Jika Anda memiliki dokumen PDF di sumber data Anda dan menggunakan Amazon OpenSearch Tanpa Server untuk toko vektor Anda: Basis pengetahuan Amazon Bedrock akan menghasilkan nomor halaman dokumen dan menyimpannya dalam field/attribute metadata yang disebut -. x-amz-bedrock-kb document-page-number* Perhatikan bahwa nomor halaman yang disimpan dalam bidang metadata tidak didukung jika Anda memilih tidak ada chunking untuk dokumen Anda.

Anda dapat menggunakan operator pemfilteran berikut untuk memfilter hasil saat Anda melakukan kueri:


**Operator penyaringan**  

| Operator | Konsol | Nama filter API | Tipe data atribut yang didukung | Hasil yang difilter | 
| --- | --- | --- | --- | --- | 
| Sama dengan | = | [sama](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-equals) | string, nomor, boolean | Atribut cocok dengan nilai yang Anda berikan | 
| Tidak sama | \$1= | [CatatanQuals](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-notEquals) | string, nomor, boolean | Atribut tidak cocok dengan nilai yang Anda berikan | 
| Lebih besar dari | > | [GreaterThan](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-greaterThan) | number | Atribut lebih besar dari nilai yang Anda berikan | 
| Lebih besar dari atau sama | >= | [greaterThanOrSama](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-greaterThanOrEquals) | number | Atribut lebih besar dari atau sama dengan nilai yang Anda berikan | 
| Kurang dari | < | [Kurang dari](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-lessThan) | number | Atribut kurang dari nilai yang Anda berikan | 
| Kurang dari atau sama | <= | [lessThanOrSama](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-lessThanOrEquals) | number | Atribut kurang dari atau sama dengan nilai yang Anda berikan | 
| Masuk | : | [di](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-in) | daftar string | Atribut ada dalam daftar yang Anda berikan (saat ini paling baik didukung dengan penyimpanan vektor Amazon OpenSearch Tanpa Server dan Neptunus Analytics GraphRag) | 
| Tidak di | \$1: | [TidakIn](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-notIn) | daftar string | Atribut tidak ada dalam daftar yang Anda berikan (saat ini paling baik didukung dengan penyimpanan vektor Amazon OpenSearch Tanpa Server dan Neptunus Analytics GraphRag) | 
| String berisi | Tidak tersedia | [StringBerisi](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-stringContains) | string | Atribut harus berupa string. Nama atribut cocok dengan kunci dan nilainya adalah string yang berisi nilai yang Anda berikan sebagai substring, atau daftar dengan anggota yang berisi nilai yang Anda berikan sebagai substring (saat ini paling baik didukung dengan penyimpanan vektor Amazon Tanpa OpenSearch Server. Penyimpanan vektor Neptunus Analytics GraphRag mendukung varian string tetapi bukan varian daftar filter ini). | 
| Daftar berisi | Tidak tersedia | [ListBerisi](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-listContains) | string | Atribut harus berupa daftar string. Nama atribut cocok dengan kunci dan nilainya adalah daftar yang berisi nilai yang Anda berikan sebagai salah satu anggotanya (saat ini paling baik didukung dengan penyimpanan vektor Amazon OpenSearch Tanpa Server). | 

Untuk menggabungkan operator penyaringan, Anda dapat menggunakan operator logis berikut:


**Operator logis**  

| Operator | Konsol | Nama bidang filter API | Hasil yang difilter | 
| --- | --- | --- | --- | 
| Dan | and | [danSemua](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-andAll) | Hasil memenuhi semua ekspresi penyaringan dalam grup | 
| Atau | atau | [atauSemua](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrievalFilter.html#bedrock-Type-agent-runtime_RetrievalFilter-orAll) | Hasil memenuhi setidaknya satu ekspresi penyaringan dalam grup | 

Untuk mempelajari cara memfilter hasil menggunakan metadata, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

Ikuti langkah-langkah konsol di [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) atau[Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md). Saat Anda membuka panel **Konfigurasi**, Anda akan melihat bagian **Filter**. Prosedur berikut menjelaskan kasus penggunaan yang berbeda:
+ Untuk menambahkan filter, buat ekspresi pemfilteran dengan memasukkan atribut metadata, operator pemfilteran, dan nilai di dalam kotak. Pisahkan setiap bagian ekspresi dengan spasi putih. Tekan **Enter** untuk menambahkan filter.

  Untuk daftar operator pemfilteran yang diterima, lihat tabel **Pemfilteran operator** di atas. Anda juga dapat melihat daftar operator pemfilteran ketika Anda menambahkan spasi setelah atribut metadata.
**catatan**  
Anda harus mengelilingi string dengan tanda kutip.

  Misalnya, Anda dapat memfilter hasil dari dokumen sumber yang berisi atribut `genre` metadata yang nilainya `"entertainment"` dengan menambahkan filter berikut:. **genre = "entertainment"**  
![\[Tambahkan satu filter.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/filter-one.png)
+ Untuk menambahkan filter lain, masukkan ekspresi penyaringan lain di dalam kotak dan tekan **Enter**. Anda dapat menambahkan hingga 5 filter dalam grup.  
![\[Tambahkan filter lain.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/filter-more.png)
+ Secara default, kueri akan mengembalikan hasil yang memenuhi semua ekspresi pemfilteran yang Anda berikan. **Untuk mengembalikan hasil yang memenuhi setidaknya satu ekspresi pemfilteran, pilih menu tarik-turun **dan** antara dua operasi penyaringan dan pilih atau.**  
![\[Ubah operasi logis antar filter.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/filter-logical.png)
+ Untuk menggabungkan operator logis yang berbeda, pilih **\$1 Tambah Grup** untuk menambahkan grup filter. Masukkan ekspresi pemfilteran di grup baru. Anda dapat menambahkan hingga 5 grup filter.  
![\[Tambahkan grup filter untuk menggabungkan operator logis yang berbeda.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/filter-group.png)
+ ****Untuk mengubah operator logis yang digunakan di antara semua grup penyaringan, pilih menu tarik-turun AND antara dua grup filter dan pilih OR.****  
![\[Ubah operasi logis antara grup filter.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/filter-group-logical.png)
+ Untuk mengedit filter, pilih, ubah operasi penyaringan, dan pilih **Terapkan**.  
![\[Edit filter.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/filter-edit.png)
+ Untuk menghapus grup filter, pilih ikon tempat sampah (![\[Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/trash.png)) di sebelah grup. Untuk menghapus filter, pilih ikon hapus (![\[Close or cancel icon represented by an "X" symbol.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/icons/close.png)) di sebelah filter.  
![\[Hapus grup filter atau filter.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/filter-delete.png)

Gambar berikut menunjukkan contoh konfigurasi filter yang mengembalikan semua dokumen yang ditulis setelah genre **2018** siapa**"entertainment"**, selain dokumen yang genre-nya **"cooking"** atau **"sports"** dan yang penulisnya dimulai**"C"**.

![\[Contoh konfigurasi filter.\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/images/kb/filter-example.png)


------
#### [ API ]

Saat Anda membuat [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)atau [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)meminta, sertakan `retrievalConfiguration` bidang, dipetakan ke [KnowledgeBaseRetrievalConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalConfiguration.html)objek. Untuk melihat lokasi bidang ini, lihat badan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)permintaan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)dan permintaan dalam referensi API.

Objek JSON berikut menunjukkan bidang minimal yang diperlukan dalam [KnowledgeBaseRetrievalConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_KnowledgeBaseRetrievalConfiguration.html)objek untuk mengatur filter untuk kasus penggunaan yang berbeda:

1. Gunakan satu operator penyaringan (lihat tabel **Operator penyaringan** di atas).

   ```
   "retrievalConfiguration": {
       "vectorSearchConfiguration": {
           "filter": {
               "<filter-type>": {
                   "key": "string",
                   "value": "string" | number | boolean | ["string", "string", ...]
               }
           }
       }
   }
   ```

1. Gunakan operator logis (lihat tabel **Operator logis** di atas) untuk menggabungkan hingga 5.

   ```
   "retrievalConfiguration": {
       "vectorSearchConfiguration": {
           "filter": {
               "andAll | orAll": [
                   "<filter-type>": {
                       "key": "string",
                       "value": "string" | number | boolean | ["string", "string", ...]
                   },
                   "<filter-type>": {
                       "key": "string",
                       "value": "string" | number | boolean | ["string", "string", ...]
                   },
                   ...
               ]
           }
       }
   }
   ```

1. Gunakan operator logis untuk menggabungkan hingga 5 operator penyaringan ke dalam grup filter, dan operator logis kedua untuk menggabungkan grup filter tersebut dengan operator penyaringan lain.

   ```
   "retrievalConfiguration": {
       "vectorSearchConfiguration": {
           "filter": {
               "andAll | orAll": [
                   "andAll | orAll": [
                       "<filter-type>": {
                           "key": "string",
                           "value": "string" | number | boolean | ["string", "string", ...]
                       },
                       "<filter-type>": {
                           "key": "string",
                           "value": "string" | number | boolean | ["string", "string", ...]
                       },
                       ...
                   ],
                   "<filter-type>": {
                       "key": "string",
                       "value": "string" | number | boolean | ["string", "string", ...]
                   }
               ]
           }
       }
   }
   ```

1. Gabungkan hingga 5 grup filter dengan menyematkannya dalam operator logis lain. Anda dapat membuat satu tingkat penyematan.

   ```
   "retrievalConfiguration": {
       "vectorSearchConfiguration": {
           "filter": {
               "andAll | orAll": [
                   "andAll | orAll": [
                       "<filter-type>": {
                           "key": "string",
                           "value": "string" | number | boolean | ["string", "string", ...]
                       },
                       "<filter-type>": {
                           "key": "string",
                           "value": "string" | number | boolean | ["string", "string", ...]
                       },
                       ...
                   ],
                   "andAll | orAll": [
                       "<filter-type>": {
                           "key": "string",
                           "value": "string" | number | boolean | ["string", "string", ...]
                       },
                       "<filter-type>": {
                           "key": "string",
                           "value": "string" | number | boolean | ["string", "string", ...]
                       },
                       ...
                   ]
               ]
           }
       }
   }
   ```

Tabel berikut menjelaskan jenis filter yang dapat Anda gunakan:


****  

| Bidang | Tipe data nilai yang didukung | Hasil yang difilter | 
| --- | --- | --- | 
| equals | string, nomor, boolean | Atribut cocok dengan nilai yang Anda berikan | 
| notEquals | string, nomor, boolean | Atribut tidak cocok dengan nilai yang Anda berikan  | 
| greaterThan | number | Atribut lebih besar dari nilai yang Anda berikan | 
| greaterThanOrEquals | number | Atribut lebih besar dari atau sama dengan nilai yang Anda berikan | 
| lessThan | number | Atribut kurang dari nilai yang Anda berikan  | 
| lessThanOrEquals | number | Atribut kurang dari atau sama dengan nilai yang Anda berikan | 
| in | daftar string | Atribut ada dalam daftar yang Anda berikan | 
| notIn | daftar string | Atribut tidak ada dalam daftar yang Anda berikan | 
| startsWith | string | Atribut dimulai dengan string yang Anda berikan (hanya didukung untuk penyimpanan vektor Amazon OpenSearch Tanpa Server) | 

Untuk menggabungkan jenis filter, Anda dapat menggunakan salah satu operator logis berikut:


****  

| Bidang | Peta ke | Hasil yang difilter | 
| --- | --- | --- | 
| andAll | Daftar hingga 5 jenis filter | Hasil memenuhi semua ekspresi penyaringan dalam grup | 
| orAll | Daftar hingga 5 jenis filter | Hasil memenuhi setidaknya satu ekspresi penyaringan dalam grup | 

Sebagai contoh, lihat [Mengirim kueri dan menyertakan filter (Ambil)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html#API_agent-runtime_Retrieve_Example_2) dan [Kirim kueri dan sertakan filter (RetrieveAndGenerate)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html#API_agent-runtime_RetrieveAndGenerate_Example_2).

------

## Pemfilteran metadata implisit
<a name="kb-test-config-implicit"></a>

Amazon Bedrock Knowledge Base menghasilkan dan menerapkan filter pengambilan berdasarkan kueri pengguna dan skema metadata.

**catatan**  
Fitur saat ini hanya berfungsi dengan AnthropicClaude 3.5 Sonnet.

`implicitFilterConfiguration`Ini ditentukan dalam `vectorSearchConfiguration` badan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)permintaan. Sertakan bidang-bidang berikut:
+ `metadataAttributes`— Dalam array ini, berikan skema yang menjelaskan atribut metadata yang model akan menghasilkan filter untuk.
+ `modelArn`— ARN dari model yang akan digunakan.

Berikut ini menunjukkan contoh skema metadata yang dapat Anda tambahkan ke array di. `metadataAttributes`

```
[
    {
        "key": "company",
        "type": "STRING",
        "description": "The full name of the company. E.g. `Amazon.com, Inc.`, `Alphabet Inc.`, etc"
    },
    {
        "key": "ticker",
        "type": "STRING",
        "description": "The ticker name of a company in the stock market, e.g. AMZN, AAPL"
    },
    {
        "key": "pe_ratio",
        "type": "NUMBER",
        "description": "The price to earning ratio of the company. This is a measure of valuation of a company. The lower the pe ratio, the company stock is considered chearper."
    },
    {
        "key": "is_us_company",
        "type": "BOOLEAN",
        "description": "Indicates whether the company is a US company."
    },
    {
        "key": "tags",
        "type": "STRING_LIST",
        "description": "Tags of the company, indicating its main business. E.g. `E-commerce`, `Search engine`, `Artificial intelligence`, `Cloud computing`, etc"
    }
]
```

## Pagar pembatas
<a name="kb-test-config-guardrails"></a>

Anda dapat menerapkan perlindungan untuk basis pengetahuan Anda untuk kasus penggunaan dan kebijakan AI yang bertanggung jawab. Anda dapat membuat beberapa pagar pembatas yang disesuaikan dengan kasus penggunaan yang berbeda dan menerapkannya di beberapa kondisi permintaan dan respons, memberikan pengalaman pengguna yang konsisten dan menstandarisasi kontrol keselamatan di seluruh basis pengetahuan Anda. Anda dapat mengonfigurasi topik yang ditolak untuk melarang topik dan filter konten yang tidak diinginkan untuk memblokir konten berbahaya dalam input dan tanggapan model. Untuk informasi selengkapnya, lihat [Mendeteksi dan memfilter konten berbahaya dengan menggunakan Amazon Bedrock Guardrails](guardrails.md).

**catatan**  
Menggunakan pagar pembatas dengan landasan kontekstual untuk basis pengetahuan saat ini tidak didukung pada Claude 3 Soneta dan Haiku.

Untuk pedoman teknik cepat umum, lihat[Konsep rekayasa yang cepat](prompt-engineering-guidelines.md).

Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

Ikuti langkah-langkah konsol di [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) atau[Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md). Di jendela pengujian, nyalakan **Hasilkan respons**. Kemudian, di panel **Konfigurasi**, perluas bagian **Guardrails**.

1. Di bagian **Guardrails**, pilih **Nama** dan **Versi** pagar pembatas Anda. **Jika Anda ingin melihat detail untuk pagar pembatas dan versi yang Anda pilih, pilih Lihat.**

   Atau, Anda dapat membuat yang baru dengan memilih tautan **Guardrail**.

1. Setelah selesai mengedit, pilih **Simpan perubahan**. Untuk keluar tanpa menyimpan pilih **Buang perubahan**.

------
#### [ API ]

Saat Anda mengajukan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)permintaan, sertakan `guardrailConfiguration` bidang di dalam `generationConfiguration` untuk menggunakan pagar pembatas Anda dengan permintaan tersebut. Untuk melihat lokasi bidang ini, lihat badan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)permintaan di referensi API.

Objek JSON berikut menunjukkan bidang minimal yang diperlukan dalam [GenerationConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerationConfiguration.html)untuk mengatur: `guardrailConfiguration`

```
"generationConfiguration": {
    "guardrailConfiguration": {
        "guardrailId": "string",
        "guardrailVersion": "string"
    }
}
```

Tentukan `guardrailId` dan pagar `guardrailVersion` pembatas pilihan Anda. 

------

## Reranking
<a name="kb-test-config-rerank"></a>

Anda dapat menggunakan model reranker untuk merank ulang hasil dari kueri basis pengetahuan. Ikuti langkah-langkah konsol di [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) atau[Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md). Saat Anda membuka panel **Konfigurasi**, perluas bagian **Reranking**. Pilih model reranker, perbarui izin jika perlu, dan ubah opsi tambahan apa pun. Masukkan prompt dan pilih **Jalankan** untuk menguji hasil setelah reranking.

## Dekomposisi kueri
<a name="kb-test-query-modifications"></a>

Dekomposisi kueri adalah teknik yang digunakan untuk memecah kueri kompleks menjadi sub-kueri yang lebih kecil dan lebih mudah dikelola. Pendekatan ini dapat membantu dalam mengambil informasi yang lebih akurat dan relevan, terutama ketika kueri awal multifaset atau terlalu luas. Mengaktifkan opsi ini dapat mengakibatkan beberapa kueri dieksekusi terhadap Basis Pengetahuan Anda, yang dapat membantu dalam respons akhir yang lebih akurat.

Misalnya, untuk pertanyaan seperti *“Siapa yang mencetak gol lebih tinggi di Piala Dunia FIFA 2022, Argentina atau Prancis?*” , Basis pengetahuan Amazon Bedrock pertama-tama dapat menghasilkan sub-kueri berikut, sebelum menghasilkan jawaban akhir:

1. *Berapa banyak gol yang dicetak Argentina di final Piala Dunia FIFA 2022?*

1. *Berapa banyak gol yang dicetak Prancis di final Piala Dunia FIFA 2022?*

------
#### [ Console ]

1. Membuat dan menyinkronkan sumber data atau menggunakan basis pengetahuan yang ada.

1. Buka jendela uji dan buka panel konfigurasi.

1. Aktifkan dekomposisi kueri.

------
#### [ API ]

```
POST /retrieveAndGenerate HTTP/1.1
Content-type: application/json
{
   "input": {
      "text": "string"
   },
   "retrieveAndGenerateConfiguration": {
      "knowledgeBaseConfiguration": {
         "orchestrationConfiguration": { // Query decomposition
           "queryTransformationConfiguration": {
                "type": "string" // enum of QUERY_DECOMPOSITION
           }
         },
...}
}
```

------

## Parameter inferensi
<a name="kb-test-model-params"></a>

Saat menghasilkan respons berdasarkan pengambilan informasi, Anda dapat menggunakan [parameter inferensi](inference-parameters.md) untuk mendapatkan kontrol lebih besar atas perilaku model selama inferensi dan memengaruhi keluaran model.

Untuk mempelajari cara memodifikasi parameter inferensi, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk memodifikasi parameter inferensi saat menanyakan basis pengetahuan** — Ikuti langkah konsol di [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) atau. [Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md) Saat Anda membuka panel **Konfigurasi**, Anda akan melihat bagian parameter **Inferensi**. Ubah parameter seperlunya.

**Untuk mengubah parameter inferensi saat mengobrol dengan dokumen Anda** — Ikuti langkah-langkahnya di. [Mengobrol dengan dokumen Anda tanpa basis pengetahuan yang dikonfigurasi](knowledge-base-chatdoc.md) Di panel **Konfigurasi**, perluas bagian **Parameter inferensi dan ubah parameter** seperlunya.

------
#### [ API ]

Anda memberikan parameter model dalam panggilan ke [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)API. Anda dapat menyesuaikan model dengan memberikan parameter inferensi di `inferenceConfig` bidang `knowledgeBaseConfiguration` (jika Anda menanyakan basis pengetahuan) atau `externalSourcesConfiguration` (jika Anda [mengobrol dengan dokumen Anda](knowledge-base-chatdoc.md)).

Di dalam `inferenceConfig` bidang adalah `textInferenceConfig` bidang yang berisi parameter berikut yang dapat Anda:
+ suhu
+ TopP
+ maxTokenCount
+ StopSequences

Anda dapat menyesuaikan model dengan menggunakan parameter berikut di `inferenceConfig` bidang keduanya `externalSourcesConfiguration` dan`knowledgeBaseConfiguration`: 
+ suhu
+ TopP
+ maxTokenCount
+ StopSequences

Untuk penjelasan rinci tentang fungsi masing-masing parameter ini, lihat[Mempengaruhi generasi respons dengan parameter inferensi](inference-parameters.md).

Selain itu, Anda dapat memberikan parameter khusus yang tidak didukung oleh `textInferenceConfig` melalui `additionalModelRequestFields` peta. Anda dapat memberikan parameter unik untuk model tertentu dengan argumen ini, untuk parameter unik lihat[Parameter permintaan inferensi dan bidang respons untuk model dasar](model-parameters.md).

Jika parameter dihilangkan dari`textInferenceConfig`, nilai default akan digunakan. Parameter apa pun yang tidak dikenali `textInferneceConfig` akan diabaikan, sementara parameter apa pun yang tidak dikenali `AdditionalModelRequestFields` akan menyebabkan pengecualian. 

Pengecualian validasi dilemparkan jika ada parameter yang sama di keduanya `additionalModelRequestFields` dan`TextInferenceConfig`.

**Menggunakan parameter model di RetrieveAndGenerate**

 Berikut ini adalah contoh struktur untuk `inferenceConfig` dan `additionalModelRequestFields` di bawah `generationConfiguration` dalam badan `RetrieveAndGenerate` permintaan:

```
"inferenceConfig": {
    "textInferenceConfig": {
        "temperature": 0.5,  
        "topP": 0.5,
        "maxTokens": 2048,
        "stopSequences": ["\nObservation"]
    }
},
"additionalModelRequestFields": {
    "top_k": 50
}
```

 Contoh proses menetapkan 0,5, 0,5, `temperature` `top_p` dari 2048, `maxTokens` menghentikan pembangkitan jika menemukan string "\$1nObservation” dalam respons yang dihasilkan, dan melewati nilai kustom `top_k` 50. 

------

## Templat prompt basis pengetahuan: orkestrasi & pembuatan
<a name="kb-test-config-prompt-template"></a>

Saat Anda menanyakan basis pengetahuan dan pembuatan respons permintaan, Amazon Bedrock menggunakan templat prompt yang menggabungkan instruksi dan konteks dengan kueri pengguna untuk membuat prompt pembuatan yang dikirim ke model untuk pembuatan respons. Anda juga dapat menyesuaikan prompt orkestrasi, yang mengubah prompt pengguna menjadi kueri penelusuran. Anda dapat merekayasa template prompt dengan alat-alat berikut:
+ **Placeholder prompt — Variabel** yang telah ditentukan sebelumnya di Pangkalan Pengetahuan Batuan Dasar Amazon yang diisi secara dinamis saat runtime selama kueri basis pengetahuan. Dalam prompt sistem, Anda akan melihat placeholder ini dikelilingi oleh simbol. `$` Daftar berikut menjelaskan placeholder yang dapat Anda gunakan:
**catatan**  
`$output_format_instructions$`Placeholder adalah bidang wajib untuk kutipan yang akan ditampilkan dalam respons.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/kb-test-config.html)
+ **Tag Anthropic XML—model** mendukung penggunaan tag XMLuntuk menyusun dan menggambarkan petunjuk Anda. Gunakan nama tag deskriptif untuk hasil yang optimal. Misalnya, dalam prompt sistem default, Anda akan melihat `<database>` tag yang digunakan untuk menggambarkan database pertanyaan yang diajukan sebelumnya). Untuk informasi selengkapnya, lihat [Menggunakan tag XMLdi](https://docs.anthropic.com/claude/docs/use-xml-tags) [panduan Anthropic pengguna](https://docs.anthropic.com/en/docs/welcome).

Untuk pedoman teknik cepat umum, lihat[Konsep rekayasa yang cepat](prompt-engineering-guidelines.md).

Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

Ikuti langkah-langkah konsol di [Kueri basis pengetahuan dan ambil data](kb-test-retrieve.md) atau[Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil](kb-test-retrieve-generate.md). Di jendela pengujian, nyalakan **Hasilkan respons**. Kemudian, di panel **Konfigurasi**, perluas bagian **template prompt dasar Pengetahuan**.

1. Pilih **Edit**.

1. Edit prompt sistem di editor teks, termasuk placeholder prompt dan tag XHTML seperlunya. Untuk kembali ke template prompt default, pilih **Reset ke default**.

1. Setelah selesai mengedit, pilih **Simpan perubahan**. Untuk keluar tanpa menyimpan prompt sistem, pilih **Buang perubahan**.

------
#### [ API ]

Saat Anda membuat [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)permintaan, sertakan `generationConfiguration` bidang, dipetakan ke [GenerationConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerationConfiguration.html)objek. Untuk melihat lokasi bidang ini, lihat badan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)permintaan di referensi API.

Objek JSON berikut menunjukkan bidang minimal yang diperlukan dalam [GenerationConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerationConfiguration.html)objek untuk mengatur jumlah maksimum hasil yang diambil untuk kembali:

```
"generationConfiguration": {
    "promptTemplate": {
        "textPromptTemplate": "string"
    }
}
```

Masukkan template prompt kustom Anda di `textPromptTemplate` bidang, termasuk placeholder prompt dan tag XHTML seperlunya. Untuk jumlah maksimum karakter yang diizinkan dalam prompt sistem, lihat `textPromptTemplate` bidang di [GenerationConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_GenerationConfiguration.html).

------

# Konfigurasikan pembuatan respons untuk model penalaran dengan Basis Pengetahuan
<a name="kb-test-configure-reasoning"></a>

Model dasar tertentu dapat melakukan penalaran model, di mana mereka mengambil tugas yang lebih besar dan kompleks dan memecahnya menjadi langkah-langkah yang lebih kecil dan lebih sederhana. Proses ini, sering disebut sebagai penalaran rantai pemikiran (CoT), dapat meningkatkan akurasi model dengan memberi model kesempatan untuk berpikir sebelum merespons. Penalaran model paling berguna untuk tugas seperti analisis multi-langkah, masalah matematika, dan tugas penalaran yang kompleks. Untuk informasi selengkapnya, lihat [Tingkatkan respons model dengan penalaran model](inference-reasoning.md).

**catatan**  
Halaman ini menjelaskan cara menggunakan konfigurasi penalaran khusus untuk Pangkalan Pengetahuan Amazon Bedrock. Untuk informasi tentang mengonfigurasi alasan untuk pemanggilan model langsung menggunakan API, lihat. `InvokeModel` [Tingkatkan respons model dengan penalaran model](inference-reasoning.md)

Ketika penalaran model diaktifkan, ini dapat menghasilkan peningkatan akurasi dengan hasil kutipan yang lebih baik tetapi dapat menghasilkan peningkatan latensi. Berikut ini adalah beberapa pertimbangan saat Anda menanyakan sumber data dan menghasilkan respons menggunakan model penalaran dengan Pangkalan Pengetahuan Amazon Bedrock.

**Topics**
+ [Model penalaran](#kb-test-reasoning-models)
+ [Menggunakan penalaran model untuk Claude 3.7 Soneta](#kb-test-reasoning-using)
+ [Pertimbangan umum](#kb-test-reasoning-general-considerations)
+ [Mengambil dan menghasilkan pertimbangan API](#kb-test-reasoning-api-considerations)

## Model penalaran
<a name="kb-test-reasoning-models"></a>

Penalaran model tersedia untuk model-model berikut.


| Model Yayasan | ID Model | Jumlah token | Konfigurasi penalaran | 
| --- | --- | --- | --- | 
| Anthropic Claude Opus 4 | anthropic.claude-opus-4-20250514-v 1:0 | Model ini akan memiliki 32.768 token, yang mencakup token output dan penalaran. | Penalaran dapat diaktifkan atau dinonaktifkan untuk model ini menggunakan anggaran token yang dapat dikonfigurasi. Secara default, penalaran dinonaktifkan. | 
| Anthropic Claude Sonnet 4 | anthropic.claude-sonnet-4-20250514-v 1:0 | Model ini akan memiliki 65.536 token, yang mencakup token output dan penalaran. | Penalaran dapat diaktifkan atau dinonaktifkan untuk model ini menggunakan anggaran token yang dapat dikonfigurasi. Secara default, penalaran dinonaktifkan. | 
| Anthropic Claude 3.7 Sonnet | anthropic.claude-3-7-sonnet-20250219-v 1:0 | Model ini akan memiliki 65.536 token, yang mencakup token output dan penalaran. | Penalaran dapat diaktifkan atau dinonaktifkan untuk model ini menggunakan anggaran token yang dapat dikonfigurasi. Secara default, penalaran dinonaktifkan. | 
| DeepSeek DeepSeek-R1 | deepseek.r1-v 1:0 | Model ini akan memiliki 8192 token, yang mencakup token output dan penalaran. Jumlah token pemikiran tidak dapat dikonfigurasi dan jumlah maksimum token keluaran tidak boleh lebih besar dari 8192. | Penalaran selalu diaktifkan untuk model ini. Model ini tidak mendukung mengaktifkan dan mematikan kemampuan penalaran. | 

## Menggunakan penalaran model untuk Claude 3.7 Soneta
<a name="kb-test-reasoning-using"></a>

**catatan**  
Penalaran model selalu diaktifkan untuk model DeepSeek -R1. Model ini tidak mendukung mengaktifkan dan mematikan kemampuan penalaran.

Saat menggunakan model Claude 3.7 Sonnet, penalaran model dapat diaktifkan atau dinonaktifkan menggunakan parameter API. `additionalModelRequestFields` [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html) Parameter ini menerima setiap pasangan kunci-nilai. Misalnya, Anda dapat menambahkan `reasoningConfig` bidang dan menggunakan `type` kunci untuk mengaktifkan atau menonaktifkan penalaran, seperti yang ditunjukkan di bawah ini.

```
{
   "input": { 
      "text": "string",
      "retrieveAndGenerateConfiguration": { 
      "knowledgeBaseConfiguration": { 
         "generationConfiguration": { 
            "additionalModelRequestFields": {
                "reasoningConfig" : {
                    "type": "enabled",
                    "budget_tokens": INT_VAL, #required when enabled
                }
            }
         },
         "knowledgeBaseId": "string",
      },
      "type": "string"
   },
   "sessionId": "string"
}
```

## Pertimbangan umum
<a name="kb-test-reasoning-general-considerations"></a>

Berikut ini adalah beberapa pertimbangan umum untuk menggunakan model penalaran untuk Basis Pengetahuan.
+ Model penalaran akan memiliki waktu hingga lima menit untuk menanggapi kueri. Jika model membutuhkan waktu lebih dari lima menit untuk menanggapi kueri, itu menghasilkan waktu habis.
+ Agar tidak melebihi batas waktu lima menit, penalaran model diaktifkan hanya pada langkah pembuatan saat Anda mengonfigurasi kueri dan pembuatan respons. Langkah orkestrasi tidak dapat memiliki penalaran model.
+ Model penalaran dapat menggunakan hingga 8192 token untuk menanggapi kueri, yang akan mencakup output dan token pemikiran. Setiap permintaan yang memiliki permintaan untuk jumlah maksimum token keluaran yang lebih besar dari batas ini akan menghasilkan kesalahan.

## Mengambil dan menghasilkan pertimbangan API
<a name="kb-test-reasoning-api-considerations"></a>

Berikut ini adalah beberapa pertimbangan saat menggunakan [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)API untuk model penalaran.
+ Secara default, ketika penalaran dinonaktifkan untuk semua model termasuk Claude 3.7 Soneta, suhu diatur ke nol. Ketika penalaran diaktifkan, suhu harus diatur ke satu.

  ```
  "inferenceConfig": {
      "textInferenceConfig": {
          "maxTokens": 8192,
          "temperature": 1
      }
  }
  ```
+ Parameter, Top P, harus dinonaktifkan saat penalaran diaktifkan untuk model Soneta Claude 3.7. Top P adalah bidang permintaan model tambahan yang menentukan persentil token yang mungkin untuk dipilih selama pembuatan. Secara default, nilai Top P untuk model Anthropic Claude lainnya adalah satu. Untuk model Claude 3.7 Sonnet, nilai ini akan dinonaktifkan secara default.
+ Ketika penalaran model digunakan, itu dapat mengakibatkan peningkatan latensi. Saat menggunakan operasi API ini dan operasi [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateStream.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateStream.html)API, Anda mungkin melihat adanya penundaan dalam menerima respons dari API.

# Terapkan basis pengetahuan Anda untuk aplikasi AI Anda
<a name="knowledge-base-deploy"></a>

Untuk menerapkan basis pengetahuan untuk aplikasi Anda, atur untuk membuat [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_Retrieve.html)atau [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html)meminta ke basis pengetahuan. Untuk melihat cara menggunakan operasi API ini untuk membuat kueri dan menghasilkan respons, lihat[Uji basis pengetahuan Anda dengan pertanyaan dan tanggapan](knowledge-base-test.md).

Anda juga dapat mengaitkan basis pengetahuan dengan agen dan agen akan memanggilnya bila diperlukan selama orkestrasi. Untuk informasi selengkapnya, lihat [Otomatiskan tugas dalam aplikasi Anda menggunakan agen AI](agents.md).

Anda harus mengkonfigurasi dan menyinkronkan data Anda source/sources dengan basis pengetahuan Anda sebelum Anda dapat menyebarkan basis pengetahuan Anda. Lihat [Sumber data yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html).

Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk mengasosiasikan basis pengetahuan dengan agen**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Dari panel navigasi kiri, pilih **Agen**.

1. Pilih agen yang ingin Anda tambahkan basis pengetahuan.

1. Di bagian **Draf kerja**, pilih **Draf kerja**.

1. Di bagian **Basis pengetahuan**, pilih **Tambah**.

1. Pilih basis pengetahuan dari daftar tarik-turun di bawah **Pilih basis pengetahuan** dan tentukan instruksi untuk agen mengenai bagaimana seharusnya berinteraksi dengan basis pengetahuan dan hasil pengembalian.

**Untuk memisahkan basis pengetahuan dengan agen**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Dari panel navigasi kiri, pilih **Agen**.

1. Pilih agen yang ingin Anda tambahkan basis pengetahuan.

1. Di bagian **Draf kerja**, pilih **Draf kerja**.

1. Di bagian **Basis pengetahuan**, pilih basis pengetahuan.

1. Pilih **Hapus**.

------
#### [ API ]

Untuk mengaitkan basis pengetahuan dengan agen, kirim [AssociateAgentKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_AssociateAgentKnowledgeBase.html)permintaan.
+ Sertakan detail `description` untuk memberikan instruksi tentang bagaimana agen harus berinteraksi dengan basis pengetahuan dan hasil pengembalian.
+ Atur `knowledgeBaseState` `ENABLED` to untuk memungkinkan agen menanyakan basis pengetahuan.

Anda dapat memperbarui basis pengetahuan yang terkait dengan agen dengan mengirimkan [UpdateAgentKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_UpdateAgentKnowledgeBase.html)permintaan. Misalnya, Anda mungkin ingin menyetel `knowledgeBaseState` `ENABLED` ke untuk memecahkan masalah. Karena semua bidang akan ditimpa, sertakan kedua bidang yang ingin Anda perbarui serta bidang yang ingin Anda pertahankan sama.

Untuk memisahkan basis pengetahuan dengan agen, kirim permintaan. [DisassociateAgentKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DisassociateAgentKnowledgeBase.html)

------

# Melihat informasi tentang basis pengetahuan Amazon Bedrock
<a name="kb-info"></a>

Anda dapat melihat informasi tentang basis pengetahuan, seperti pengaturan dan status.

Untuk memantau basis pengetahuan Anda menggunakan CloudWatch log Amazon, lihat [Pencatatan basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-bases-logging.html).

Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk melihat informasi tentang basis pengetahuan**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Untuk melihat detail basis pengetahuan, pilih **Nama** sumber atau pilih tombol radio di sebelah sumber dan pilih **Edit**.

1. Pada halaman detail, Anda dapat melakukan tindakan berikut:
   + Untuk mengubah detail basis pengetahuan, pilih **Edit** di bagian **Ikhtisar basis pengetahuan**.
   + Untuk memperbarui tag yang dilampirkan ke basis pengetahuan, pilih **Kelola tag** di bagian **Tag**.
   + Jika Anda memperbarui sumber data dari mana basis pengetahuan dibuat dan perlu menyinkronkan perubahan, pilih **Sinkronkan** di bagian **Sumber data**.
   + Untuk melihat detail sumber data, pilih **nama sumber data**. Dalam detailnya, Anda dapat memilih tombol radio di sebelah acara sinkronisasi di bagian **Riwayat sinkronisasi** dan pilih **Lihat peringatan** untuk melihat mengapa file dalam pekerjaan pengambilan data gagal disinkronkan.
   + Untuk mengelola model embeddings vektor yang digunakan untuk basis pengetahuan, pilih **Edit** Throughput yang Disediakan.
   + Pilih **Simpan perubahan** setelah Anda selesai mengedit.

------
#### [ API ]

Untuk mendapatkan informasi tentang basis pengetahuan, kirim [GetKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetKnowledgeBase.html)permintaan dengan [titik akhir waktu pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt), dengan menentukan. `knowledgeBaseId`

Untuk mencantumkan informasi tentang basis pengetahuan Anda, kirim [ListKnowledgeBases](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListKnowledgeBases.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Anda dapat mengatur jumlah hasil maksimum yang akan dikembalikan sebagai respons. Jika ada lebih banyak hasil daripada angka yang Anda tetapkan, respons mengembalikan a`nextToken`. Anda dapat menggunakan nilai ini di `nextToken` bidang [ListKnowledgeBases](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListKnowledgeBases.html)permintaan lain untuk melihat kumpulan hasil berikutnya.

------

# Memodifikasi basis pengetahuan Amazon Bedrock
<a name="kb-update"></a>

Anda dapat memperbarui basis pengetahuan, seperti mengubah konfigurasi basis pengetahuan.

Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk memperbarui basis pengetahuan**

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Pilih basis pengetahuan untuk melihat detailnya, atau pilih tombol radio di sebelah basis pengetahuan dan pilih **Edit**.

1. Anda dapat memodifikasi basis pengetahuan dengan cara berikut.
   + Ubah konfigurasi untuk basis pengetahuan dengan memilih **Edit** di bagian **ikhtisar basis Pengetahuan**.
   + Ubah dan kelola tag yang dilampirkan ke basis pengetahuan dengan memilih **Kelola tag** di bagian **Tag**
   + Ubah dan kelola sumber data untuk basis pengetahuan di bagian **Sumber data**.

1. Pilih **Simpan perubahan** setelah Anda selesai mengedit.

------
#### [ API ]

Untuk memperbarui basis pengetahuan, kirim [UpdateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_UpdateKnowledgeBase.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Karena semua bidang akan ditimpa, sertakan kedua bidang yang ingin Anda perbarui serta bidang yang ingin Anda pertahankan sama.

------

# Hapus basis pengetahuan Amazon Bedrock
<a name="kb-delete"></a>

Anda dapat menghapus atau menghapus basis pengetahuan yang tidak lagi Anda gunakan atau butuhkan. Saat Anda menghapus basis pengetahuan, Anda juga harus melakukan tindakan berikut untuk sepenuhnya menghapus semua sumber daya yang terkait dengan basis pengetahuan.
+ Putuskan basis pengetahuan dari agen apa pun yang terkait dengannya.
+ Hapus penyimpanan vektor itu sendiri untuk basis pengetahuan Anda.

**catatan**  
Default `dataDeletionPolicy` pada sumber data yang baru dibuat adalah “Hapus”, kecuali ditentukan lain selama pembuatan sumber data. Kebijakan ini berlaku saat Anda menghapus basis pengetahuan atau sumber daya sumber data. Anda dapat memperbarui kebijakan untuk “Menyimpan” data dari sumber data yang diubah menjadi embeddings vektor. Perhatikan bahwa **penyimpanan vektor itu sendiri tidak dihapus** jika Anda menghapus basis pengetahuan atau sumber daya sumber data.

Pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk menghapus basis pengetahuan**

1. Sebelum langkah-langkah berikut, pastikan untuk menghapus basis pengetahuan dari agen mana pun yang terkait dengannya. Untuk melakukan ini, lakukan langkah-langkah berikut:

   1. Dari panel navigasi kiri, pilih **Agen**.

   1. Pilih **Nama** agen tempat Anda ingin menghapus basis pengetahuan.

   1. Spanduk merah muncul untuk memperingatkan Anda untuk menghapus referensi ke basis pengetahuan, yang sudah tidak ada lagi, dari agen.

   1. Pilih tombol radio di sebelah basis pengetahuan yang ingin Anda hapus. Pilih **Lainnya** dan kemudian pilih **Hapus**.

1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock).

1. Di panel navigasi kiri, pilih **Basis pengetahuan**.

1. Pilih basis pengetahuan atau pilih tombol radio di sebelah basis pengetahuan. Lalu pilih **Hapus**.

1. Tinjau peringatan untuk menghapus basis pengetahuan. Jika Anda menerima kondisi ini, masukkan **delete** di kotak input dan pilih **Hapus** untuk mengonfirmasi.
**catatan**  
**Penyimpanan vektor itu sendiri tidak dihapus**, hanya data. Anda dapat menggunakan konsol penyimpanan vektor atau SDK untuk menghapus penyimpanan vektor. Pastikan juga untuk memeriksa agen Amazon Bedrock yang Anda gunakan dengan basis pengetahuan Anda.

------
#### [ API ]

Untuk menghapus basis pengetahuan, kirim [DeleteKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DeleteKnowledgeBase.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt).

Anda juga harus memisahkan basis pengetahuan dari agen apa pun yang terkait dengannya dengan membuat [DisassociateAgentKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_DisassociateAgentKnowledgeBase.html)permintaan dengan titik akhir waktu [pembuatan Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt).

Anda juga harus menghapus penyimpanan vektor itu sendiri dengan menggunakan konsol toko vektor atau SDK untuk menghapus penyimpanan vektor.

------