Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menambahkan dokumen langsung ke indeks dengan batch upload
Anda dapat menambahkan dokumen langsung ke indeks menggunakan file BatchPutDocumentAPI. Anda tidak dapat menambahkan dokumen secara langsung menggunakan konsol tersebut. Jika Anda menggunakan konsol, Anda terhubung ke sumber data untuk menambahkan dokumen ke indeks Anda. Dokumen dapat ditambahkan dari bucket S3 atau disediakan sebagai data biner. Untuk daftar jenis dokumen yang didukung oleh Amazon Kendra lihat Jenis dokumen.
Menambahkan dokumen ke indeks menggunakan BatchPutDocument
adalah operasi asinkron. Setelah Anda menelepon BatchPutDocument
API, Anda menggunakan BatchGetDocumentStatusAPIuntuk memantau kemajuan pengindeksan dokumen Anda. Ketika Anda memanggil BatchGetDocumentStatus
API dengan daftar dokumenIDs, ia mengembalikan status dokumen. Ketika status dokumen menjadi INDEXED
atau FAILED
, pemrosesan dokumen selesai. Ketika statusnyaFAILED
, BatchGetDocumentStatus
API mengembalikan alasan bahwa dokumen tidak dapat diindeks.
Jika Anda ingin mengubah bidang atau atribut metadata konten dan dokumen selama proses penyerapan dokumen, lihat Pengayaan Dokumen Kustom.Amazon Kendra Jika Anda ingin menggunakan sumber data kustom, setiap dokumen yang Anda BatchPutDocument
API kirimkan menggunakan ID sumber data dan ID eksekusi sebagai atribut atau bidang. Untuk informasi selengkapnya, lihat Atribut yang diperlukan untuk sumber data kustom.
catatan
Setiap ID dokumen harus unik per indeks. Anda tidak dapat membuat sumber data untuk mengindeks dokumen Anda dengan IDs keunikannya dan kemudian menggunakannya BatchPutDocument
API untuk mengindeks dokumen yang sama, atau sebaliknya. Anda dapat menghapus sumber data dan kemudian menggunakan BatchPutDocument
API untuk mengindeks dokumen yang sama, atau sebaliknya. Menggunakan BatchPutDocument
dan BatchDeleteDocument
APIs dalam kombinasi dengan konektor sumber Amazon Kendra
data untuk kumpulan dokumen yang sama dapat menyebabkan ketidakkonsistenan dengan data Anda. Sebagai gantinya, sebaiknya gunakan konektor sumber data Amazon Kendra khusus.
Dokumen panduan pengembang berikut menunjukkan cara menambahkan dokumen langsung ke indeks.
Menambahkan dokumen dengan BatchPutDocument API
Contoh berikut menambahkan gumpalan teks ke indeks dengan memanggil BatchPutDocument. Anda dapat menggunakan BatchPutDocument
API untuk menambahkan dokumen langsung ke indeks Anda. Untuk daftar jenis dokumen yang didukung oleh Amazon Kendra lihat Jenis dokumen.
Untuk contoh membuat indeks menggunakan AWS CLI danSDKs, lihat Membuat indeks. Untuk mengatur CLI danSDKs, lihat Menyiapkan Amazon Kendra.
catatan
File yang ditambahkan ke indeks harus dalam aliran byte yang dikodekan UTF -8.
Dalam contoh berikut, UTF -8 teks yang dikodekan ditambahkan ke indeks.
Menambahkan dokumen dari bucket S3
Anda dapat menambahkan dokumen langsung ke indeks Anda dari Amazon S3 bucket menggunakan file BatchPutDocumentAPI. Anda dapat menambahkan hingga 10 dokumen dalam panggilan yang sama. Saat menggunakan bucket S3, Anda harus memberikan IAM peran dengan izin untuk mengakses bucket yang berisi dokumen Anda. Anda menentukan peran dalam parameter RoleArn
.
Menggunakan BatchPutDocumentAPIuntuk menambahkan dokumen dari Amazon S3 ember adalah operasi satu kali. Untuk menjaga indeks tetap disinkronkan dengan isi bucket, buat sumber Amazon S3 data. Untuk informasi selengkapnya, lihat sumber Amazon S3 data.
Untuk contoh membuat indeks menggunakan AWS CLI danSDKs, lihat Membuat indeks. Untuk mengatur CLI danSDKs, lihat Menyiapkan Amazon Kendra. Untuk informasi tentang membuat bucket S3, lihat Amazon Simple Storage Service dokumentasi.
Dalam contoh berikut, dua dokumen Microsoft Word ditambahkan ke indeks menggunakan file BatchPutDocument
API.