Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Membuat konektor sumber data
Anda dapat membuat konektor sumber data Amazon Kendra untuk menghubungkan dan mengindeks dokumen Anda. Amazon Kendra dapat terhubung ke Microsoft SharePoint, Google Drive, dan banyak penyedia lainnya. Saat Anda membuat konektor sumber data, Anda memberikan informasi konfigurasi Amazon Kendra yang diperlukan untuk terhubung ke repositori sumber Anda. Tidak seperti menambahkan dokumen langsung ke indeks, Anda dapat memindai sumber data secara berkala untuk memperbarui indeks.
Misalnya, katakanlah Anda memiliki gudang dokumen pajak yang disimpan dalam ember. Amazon S3 Dari waktu ke waktu, dokumen yang ada diubah dan dokumen baru ditambahkan ke repositori. Jika Anda menambahkan repositori Amazon Kendra sebagai sumber data, Anda dapat memperbarui indeks Anda dengan mengatur sinkronisasi berkala antara sumber data dan indeks Anda.
Anda dapat memilih untuk memperbarui indeks secara manual menggunakan konsol atau StartDataSourceSyncJobAPI. Jika tidak, Anda mengatur jadwal untuk memperbarui indeks dan menyinkronkannya dengan sumber data Anda.
Indeks dapat memiliki lebih dari satu sumber data. Setiap sumber data dapat memiliki jadwal pembaruannya sendiri. Misalnya, Anda dapat memperbarui indeks dokumen kerja Anda setiap hari, atau bahkan per jam, sembari memperbarui dokumen yang diarsipkan secara manual kapan pun arsip berubah.
catatan
Setiap ID dokumen harus unik per indeks. Anda tidak dapat membuat sumber data untuk mengindeks dokumen Anda dengan IDs keunikannya dan kemudian menggunakan BatchPutDocument
API untuk mengindeks dokumen yang sama, atau sebaliknya. Anda dapat menghapus sumber data dan kemudian menggunakan BatchPutDocument
API untuk mengindeks dokumen yang sama, atau sebaliknya. Menggunakan BatchPutDocument
dan BatchDeleteDocument
APIs dalam kombinasi dengan konektor sumber Amazon Kendra data untuk kumpulan dokumen yang sama dapat menyebabkan ketidakkonsistenan dengan data Anda. Sebagai gantinya, sebaiknya gunakan konektor sumber data Amazon Kendra khusus.
catatan
File yang ditambahkan ke indeks harus dalam pengaliran byte yang dikodekan dengan UTF-8. Untuk informasi selengkapnya tentang dokumen di Amazon Kendra, lihat Dokumen.
Mengatur jadwal pembaruan
Konfigurasikan sumber data Anda untuk diperbarui secara berkala dengan konsol tersebut atau menggunakan parameter Schedule
saat membuat atau memperbarui sumber data. Isi parameter adalah string yang menyimpan string jadwal cron
-format atau string kosong untuk menunjukkan bahwa indeks diperbarui sesuai permintaan. Untuk format ekspresi cron, lihat Menjadwalkan Ekspresi untuk Aturan di Panduan Amazon CloudWatch Events Pengguna. Amazon Kendra hanya mendukung ekspresi cron. Itu tidak mendukung ekspresi tingkat.
Mengatur bahasa
Anda dapat mengindeks semua dokumen Anda dalam sumber data dalam bahasa yang didukung. Anda menentukan kode bahasa untuk semua dokumen Anda di sumber data Anda saat Anda menelepon CreateDataSource. Jika dokumen tidak memiliki kode bahasa yang ditentukan dalam bidang metadata, dokumen diindeks menggunakan kode bahasa yang ditentukan untuk semua dokumen di tingkat sumber data. Jika Anda tidak menentukan bahasa, Amazon Kendra indeks dokumen dalam sumber data dalam bahasa Inggris secara default. Untuk informasi selengkapnya tentang bahasa yang didukung, termasuk kodenya, lihat Menambahkan dokumen dalam bahasa selain bahasa Inggris.
Anda mengindeks semua dokumen dalam sumber data dalam bahasa yang didukung menggunakan konsol. Buka Sumber data dan edit sumber data Anda atau Tambahkan sumber data jika Anda menambahkan sumber data baru. Pada halaman Tentukan detail sumber data, pilih bahasa dari Bahasa tarik-turun. Anda memilih Perbarui atau terus memasukkan informasi konfigurasi untuk terhubung ke sumber data Anda.