Mengatasi masalah sumber data - Amazon Kendra

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengatasi masalah sumber data

Bagian ini dapat membantu Anda memecahkan masalah umum saat mengonfigurasi dan menggunakan konektor sumber Amazon Kendra data.

Dokumen saya tidak diindeks

Ketika Anda menyinkronkan Amazon Kendra indeks Anda dengan sumber data, Anda mungkin mengalami masalah yang mencegah dokumen diindeks. Pengindeksan adalah proses dua langkah. Pertama, sumber data diperiksa untuk dokumen baru dan diperbarui untuk diindeks, dan untuk menemukan dokumen untuk dihapus dari indeks. Kedua, pada tingkat dokumen, setiap dokumen diakses dan diindeks.

Kesalahan dapat terjadi di salah satu langkah berikut. Kesalahan tingkat sumber data dilaporkan di konsol dalam bagian riwayat jalan sinkronisasi dari halaman detail sumber data. Status tugas sinkronisasi dapat Berhasil, Tidak lengkap, atau Gagal. Anda juga dapat melihat jumlah dokumen yang diindeks dan dihapus selama tugas berlangsung. Jika statusnya adalah Gagal, pesan akan ditampilkan dalam kolom Detail.

Kesalahan tingkat dokumen dilaporkan dalam Amazon CloudWatch Logs. Anda dapat melihat kesalahan menggunakan CloudWatch konsol.

Untuk membuat laporan status sinkronisasi dokumen, lihat Saya ingin membuat laporan status sinkronisasi untuk dokumen saya.

Tugas sinkronisasi saya gagal

Tugas sinkronisasi biasanya gagal ketika ada kesalahan konfigurasi dalam indeks atau sumber data. Di konsol, Anda dapat menemukan pesan kesalahan di bagian Sync run history pada halaman detail sumber data, di bawah kolom Detail. Kesalahan tingkat dokumen dilaporkan dalam Amazon CloudWatch Logs. Pesan kesalahan memberikan informasi tentang apa yang salah. Masalahnya biasanya indeks atau sumber data tidak memiliki IAM izin yang tepat. Pesan kesalahan menjelaskan izin yang hilang. Berikut beberapa pesan kesalahan yang dapat Anda terima:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

Jika peran indeks Anda tidak memiliki izin untuk digunakan CloudWatch, sumber data tidak akan dapat membuat CloudWatch log. Jika Anda mendapatkan kesalahan ini, Anda harus menambahkan CloudWatch izin ke peran indeks.

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

Bila Anda menggunakan sumber Amazon S3 data, Amazon Kendra harus memiliki izin untuk mengakses bucket yang berisi dokumen. Anda perlu menambahkan izin Amazon Kendra untuk membaca bucket ke IAM peran sumber data.

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra membutuhkan izin untuk mengasumsikan IAM peran indeks dan sumber data. Anda perlu menambahkan kebijakan kepercayaan ke peran dengan izin untuk tindakan sts:AssumeRole.

Untuk IAM kebijakan yang Amazon Kendra perlu mengindeks sumber data, lihat IAM peran.

Untuk membuat laporan status sinkronisasi dokumen, lihat Saya ingin membuat laporan status sinkronisasi untuk dokumen saya.

Tugas sinkronisasi saya tidak lengkap

Pekerjaan umumnya tidak lengkap ketika mereka telah menyelesaikan proses tingkat sumber data tetapi memiliki beberapa kesalahan selama proses tingkat dokumen. Ketika pekerjaan tidak lengkap, beberapa dokumen mungkin tidak berhasil diindeks. Untuk sumber Amazon S3 data, pekerjaan yang tidak lengkap biasanya disebabkan oleh:

  • Metadata yang tidak valid untuk satu atau lebih dokumen.

  • Ketika dokumen diserahkan untuk pengindeksan tetapi setidaknya satu dokumen tidak diserahkan.

  • Ketika dokumen diserahkan untuk dihapus dari indeks tetapi setidaknya satu dokumen tidak diserahkan.

Untuk memecahkan masalah pekerjaan sinkronisasi yang tidak lengkap, lihat dulu log Anda. CloudWatch

  1. Dari kolom detail, pilih Lihat detail di CloudWatch.

  2. Meninjau pesan kesalahan untuk melihat apa yang menyebabkan dokumen gagal.

Untuk membuat laporan status sinkronisasi dokumen, lihat Saya ingin membuat laporan status sinkronisasi untuk dokumen saya.

Tugas sinkronisasi saya berhasil tetapi tidak ada dokumen yang diindeks

Kadang-kadang, pekerjaan sinkronisasi indeks akan ditandai sebagai Berhasil tetapi tidak ada dokumen baru atau diperbarui yang diindeks saat Anda mengharapkannya. Alasan yang mungkin termasuk:

  • Periksa CloudWatch DocumentsSubmittedForIndexingFailed metrik untuk melihat apakah ada dokumen yang gagal disinkronkan. Periksa CloudWatch log Anda untuk detailnya.

  • Untuk sumber Amazon S3 data, Anda mungkin telah memberikan Amazon Kendra nama bucket atau awalan yang salah. Pastikan bucket yang digunakan Amazon Kendra adalah yang berisi dokumen untuk diindeks.

  • Saat mengindeks ulang dokumen yang gagal diindeks di pekerjaan sebelumnya, tidak Amazon Kendra akan mengindeksnya kecuali Anda telah mengubah dokumen atau file metadata terkait.

Untuk membuat laporan status sinkronisasi dokumen, lihat Saya ingin membuat laporan status sinkronisasi untuk dokumen saya.

Saya mengalami masalah format file saat menyinkronkan sumber data saya

Jika Anda mengalami masalah format file saat menambahkan file ke sumber data Anda atau menyinkronkan sumber data Anda, pastikan bahwa jenis dokumen Anda Amazon Kendra didukung. Untuk daftar jenis dokumen yang didukung oleh Amazon Kendra lihat Jenis atau format dokumen.

Jika Anda menggunakan BatchPutDocument API dengan file teks biasa, tentukan PLAIN_TEXT sebagai tipe konten.

Saya ingin membuat laporan riwayat sinkronisasi untuk dokumen saya

Saat Anda menyinkronkan konektor sumber Amazon Kendra data, Amazon Kendra dapat menghasilkan laporan status sinkronisasi untuk setiap dokumen di sumber data Anda dan menyalinnya ke Amazon S3 bucket. Selama proses ini, data Anda dienkripsi menggunakan AWS KMS kunci dan hanya dapat dilihat oleh Anda. Status dokumen yang dilaporkan dapat berupa salah satu dari berikut: Gagal, Selesai, atau Berhasil dengan kesalahan.

Sebelum Anda dapat membuat laporan status sinkronisasi, Anda harus melakukan hal berikut:

  • Tambahkan prinsip Amazon Kendra layanan berikut ke kebijakan Amazon S3 akses Anda

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • Buat Amazon S3 bucket dengan izin akses ke Amazon Kendra

Jika Anda menggunakan konsol, untuk membuat laporan status sinkronisasi, pilih untuk mengaktifkan opsi Pembuatan riwayat sinkronisasi dari halaman Detail sumber data. Kemudian, masukkan lokasi Amazon S3 bucket dan pilih dari opsi konfigurasi yang tersedia. Laporan akan dihasilkan dari sinkronisasi berikutnya setelah Anda mengaktifkan laporan generate.

Jika Anda menghapus Amazon S3 bucket, Anda akan kehilangan data log dan harus menyiapkan bucket baru untuk menyimpan laporan sinkronisasi baru.

Menghasilkan status laporan sinkronisasi saat ini hanya didukung untuk Amazon S3 konektor.

Berapa lama waktu yang dibutuhkan untuk menyinkronkan sumber data?

Jika tidak ada pembaruan dokumen, waktu sinkronisasi untuk Amazon Kendra indeks meningkat dalam proporsi linier dengan jumlah dokumen. Misalnya, 1.000 dokumen tanpa pembaruan akan memakan waktu sekitar lima menit untuk disinkronkan dan 2.000 dokumen tanpa pembaruan akan memakan waktu sekitar 10 menit. Jika ada pembaruan pada dokumen, maka waktu sinkronisasi akan meningkat berdasarkan jumlah dokumen yang diperbarui.

Berapa biaya untuk menyinkronkan sumber data?

Saat Anda menyinkronkan indeks Anda, dibutuhkan dua menit untuk melakukan pemanasan dan mengaktifkan Amazon EC2 untuk membuat koneksi yang diperlukan. Anda tidak dikenakan biaya selama proses ini. Pengukur penggunaan Anda dimulai hanya setelah pekerjaan sinkronisasi dimulai. Untuk informasi lebih lanjut tentang Amazon Kendra harga, lihat Amazon Kendra harga.

Saya mendapatkan kesalahan Amazon EC2 otorisasi

Jika terjadi kesalahan operasi yang Amazon EC2 tidak sah selama sinkronisasi untuk sumber data virtual private cloud (VPC), kemungkinan peran IAM VPC Anda tidak memiliki izin yang diperlukan. Harap periksa apakah IAM peran yang Anda gunakan untuk sumber data Anda memiliki izin terlampir. Untuk informasi selengkapnya, lihat IAM Peran cloud pribadi virtual.

Amazon Kendra Indeks Anda hanya dapat mengakses file yang sumber Amazon S3 data memberikan izin untuk mengaksesnya. Misalnya, Amazon Kendra tidak dapat mengubah Amazon S3 izin yang menentukan apakah suatu objek dimaksudkan untuk publik atau dienkripsi. Amazon Kendra juga tidak memiliki izin default untuk membuat atau mengembalikan tautan yang ditandatangani untuk Amazon S3 objek. Jika Anda ingin mengaktifkan penautan yang ditandatangani untuk Amazon S3 objek dalam Amazon Kendra indeks, Anda memiliki dua opsi:

  • Anda dapat menggunakan tanda tangani hasil kueri indeks Anda dengan objek uri sumber sebelum mengembalikan hasilnya ke halaman pencarian. Untuk step-by-step panduan proses ini, lihat Berbagi objek menggunakan URL yang telah ditetapkan sebelumnya.

  • Anda dapat mengganti uri sumber metadata Amazon S3 objek dan membuat layanan Anda tersedia melalui jaringan pengiriman CloudFront konten (CDN) yang terhubung ke bucket. Amazon S3 Atau, Anda dapat menggunakan titik akhir API Gateway proxy yang mengembalikan URL yang telah ditetapkan sebelumnya dan mengarahkan ulang ke URL tersebut.

Saya mendapatkan pesan kesalahan AccessDenied Saat Menggunakan File Sertifikat SSL

Jika Anda mendapatkan kesalahan akses ditolak saat menggunakan sertifikat SSL dengan sumber data Anda, pastikan IAM peran Anda memiliki izin untuk mengakses file sertifikat SSL di lokasi yang ditentukan. Jika sertifikat dienkripsi dengan AWS KMS kunci, IAM peran Anda juga harus memiliki izin untuk mendekripsi menggunakan kunci. AWS KMS Untuk informasi selengkapnya, lihat Otentikasi dan kontrol akses untuk AWS KMS.

Saya mendapatkan kesalahan otorisasi saat menggunakan sumber SharePoint data

Jika Anda mendapatkan kesalahan otorisasi saat menyinkronkan indeks Anda dengan sumber SharePoint data, konfirmasikan bahwa Anda memiliki peran Admin Situs yang ditetapkan untuk Anda. SharePoint

Indeks saya tidak merayapi dokumen dari sumber data Confluence saya

Jika Amazon Kendra indeks Anda tidak merayapi dokumen dari sumber data Confluence selama proses sinkronisasi, konfirmasikan bahwa Anda adalah bagian dari Grup Administrator di Confluence.