疑難排解資料來 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

疑難排解資料來

本節可以幫助您解決配置和使用時的常見問題 Amazon Kendra 資料來源連接器。

我的文件沒有編製索引

當您同步 Amazon Kendra 使用資料來源建立索引時,您可能會遇到阻止文件編製索引的問題。索引是一個兩個步驟的過程。首先,檢查資料來源是否有要建立索引的新文件和更新文件,並尋找要從索引中移除的文件。其次,在文檔級別,每個文檔被訪問和索引。

在這些步驟之一中都可能發生錯誤。資料來源詳細資料頁面的 [同步執行歷程記錄] 區段的主控台中會報告資料來源層級錯誤。同步化工作的狀態可以是「成」、「未成」或「失敗」。您也可以查看工作期間編製索引和刪除的文件數目。如果狀態為「失敗」,則「詳細資料」欄中會顯示訊息。

文件層級錯誤報告於 Amazon CloudWatch Logs。 你可以看到錯誤 CloudWatch 控制台。

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我的同步工作失敗

當索引或資料來源中發生組態錯誤時,同步化工作通常會失敗。在主控台中,您可以在資料來源詳細資料頁面的 [詳細資料] 欄下的 [同步執行歷程記錄] 區段中找到錯誤訊息。文件層級錯誤報告於 Amazon CloudWatch Logs。 錯誤消息提供了有關出錯的信息。問題通常是索引或數據源沒有適當的 IAM 權限。錯誤訊息會描述遺失的權限。以下是您可以收到的一些錯誤訊息:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

如果您的索引角色沒有使用權限 CloudWatch,資料來源將無法建立 CloudWatch 日誌。如果出現此錯誤,則必須添加 CloudWatch 索引角色的權限。

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

當您使用 Amazon S3 資料來源, Amazon Kendra 必須具有存取包含文件之值區的權限。您需要為以下項目新增權限 Amazon Kendra 將存儲桶讀取到數據源 IAM 角色。

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra 需要權限來承擔索引和數據源 IAM 角色。您需要將信任原則新增至具有sts:AssumeRole動作權限的角色。

對於 IAM 政策 Amazon Kendra 需要為資料來源建立索引,請參閱 IAM 角色

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我的同步工作不完整

工作通常在完成資料來源層級程序後不完整,但在文件層級處理期間出現一些錯誤。當工作不完整時,某些文件可能未成功編製索引。對於一個 Amazon S3 資料來源,不完整的工作通常是由下列原因造成:

  • 一或多個文件的中繼資料無效。

  • 提交文件進行索引,但至少有一份文件未提交時。

  • 提交要從索引中刪除的文件,但至少有一份文件未提交時。

若要疑難排解不完整的同步工作,請先查看 CloudWatch 日誌。

  1. 從詳細資料欄中,選擇檢視詳細資料於 CloudWatch.

  2. 檢閱錯誤訊息以查看導致文件失敗的原因。

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我的同步處理工作成功,但沒有索引文件

有時候,索引同步處理工作執行會標示為「成功」,但沒有新文件或更新的文件在您預期的情況下編製索引。可能的原因包括:

  • Check CloudWatch DocumentsSubmittedForIndexingFailed測量結果,以查看是否有任何文件無法同步化。檢查您的 CloudWatch 日誌中的詳細信息。

  • 對於一個 Amazon S3 資料來源,您可能已經提供 Amazon Kendra 錯誤的存儲桶名稱或前綴。確保桶 Amazon Kendra 正在使用的是包含要索引的文檔的那個。

  • 當重新建立索引之前工作中無法編製索引的文件時, Amazon Kendra 除非您已更改文檔或其關聯的元數據文件,否則不會對其進行索引。

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我在同步資料來源時遇到檔案格式問題

如果您在將檔案新增至資料來源或同步資料來源時遇到檔案格式問題,請確定您的文件類型為 Amazon Kendra 支持。如需支援的文件類型清單 Amazon Kendra 請參閱文件類型或格式

如果您使用的BatchPutDocumentAPI是純文字檔案,請指定PLAIN_TEXT為內容類型。

我想要為我的文件產生同步記錄報告

您可以選取檢視報告,在中檢視資料來源同步工作 CloudWatch 的文件層級同步執行歷程記錄報告。同步運行歷史記錄報告將包含同步工作中每個文檔的進度和狀態的詳細信息。它會顯示在編目、同步處理和索引階段期間,文件是否成功、失敗或已略過。您還可以找到與失敗或跳過的文檔相關的任何錯誤消息。如果報告未顯示進行中同步工作的結果,則可能尚未提供記錄檔。在同步處理期間發生事件時,資料會發送至報表時,請稍後再回來查看。

若要存取您的同步執行歷程記錄報告,請執行下列步驟:

  1. https://console.aws.amazon.com/kendra/打開 Amazon Kendra 控制台。

  2. 從左側導覽功能表的 [資料管理] 下,選擇 [資料來源],然後選擇您的資料來源。

  3. 在資料來源摘要頁面中,向下捲動並選取 [同步歷程記錄] 索引標籤。

  4. 同步執行歷程記錄中,選取動作

  5. 動作中,選取檢視報表。您將被重定向到 CloudWatch 控制台,您將可以在其中訪問您的報告。

注意

同步執行歷程記錄是否在擷取期間成功編製文件索引 (包括附加ACLs和中繼資料),以記錄所有 Amazon Kendra 支援的連接器。

如果您使用的是 Amazon S3 連接器:

除了檢視中的文件層級同步執行歷史記錄報告之外 CloudWatch,您還可以為 Amazon S3 資料來源中的每個文件產生同步歷史記錄報告,並將其複製到 Amazon S3 桶。在此過程中,您的數據將使用 AWS KMS 鑰匙,只能由您查看。報告的文件狀態可以是下列其中一種:「失敗」、「已完成」或「成功但有錯誤」。您必須先執行下列動作,才能產生 Amazon S3 的同步狀態報告:

  • 添加以下內容 Amazon Kendra 您的服務主要 Amazon S3 存取原則

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • 創建一個 Amazon S3 具有存取權限的值區 Amazon Kendra

如果您使用主控台,若要產生 Amazon S3 的同步歷史記錄報告,請從 [資料來源詳細資料] 頁面上的 [同步歷史記錄報告-用] 區段中選擇啟用產生報告選項。然後,輸入 Amazon S3 值區位置,並從可用的組態選項中進行選擇。啟動產生報告後,將從下次同步處理產生報告。

如果您刪除 Amazon S3 存儲桶,您將丟失日誌數據,並且必須設置一個新存儲桶來存儲新的同步報告。

注意

同步歷史記錄報告僅提供 Amazon S3 連接器是否成功編目和擷取資料的相關資訊。

同步資料來源需要多少時間?

如果文件沒有更新,請同步時間 Amazon Kendra 索引以線性比例的文件數量增加。例如,1,000 份沒有任何更新的文件大約需要 5 分鐘才能同步處理,而 2,000 份文件而沒有任何更新則大約需要 10 分鐘。如果文件有任何更新,則同步時間會根據更新的文件數量而增加。

同步資料來源的費用為何?

當您同步索引時,需要兩分鐘才能預熱並啟動 Amazon EC2 建立必要的連接。在此過程中,您不會收取任何費用。您的使用量計量器只會在同步工作開始後開始。有關更多信息 Amazon Kendra 定價,請參閱 Amazon Kendra 定價

我得到一個 Amazon EC2 授權錯誤

如果 Amazon EC2 在同步虛擬私有雲 (VPC) 資料來源期間發生未經授權的作業錯誤,很可能是您的 VPC IAM 角色缺少必要的權限。請檢查 IAM 您用於資料來源的角色具有附加權限。如需詳細資訊,請參閱虛擬私有雲 IAM 角色

您的 Amazon Kendra 索引只能訪問文件 Amazon S3 資料來源授與其存取權限。例如 Amazon Kendra 無法修改 Amazon S3 決定物件是要公開還是加密的權限。 Amazon Kendra 也沒有創建或返回已簽名鏈接的默認權限 Amazon S3 物件。如果您想要啟用已簽署的連結 Amazon S3 中的物件 Amazon Kendra 索引,你有兩個選擇:

  • 在將結果傳回至搜尋頁面之前,您可以使用來源 uri 物件來簽署索引查詢結果。如需此程序的 step-by-step逐步解說,請參閱使用預先簽署URLs的共用物件

  • 您可以覆寫 Amazon S3 物件中繼資料來源 uri,並透過 CloudFront 內容傳遞網路 (CDN) 連接至 Amazon S3 桶。或者,您可以使用 API Gateway 代理端點,返回一個預先簽名URL並重定向到它。

我收到「使用SSL憑證檔案AccessDenied 時」錯誤訊息

如果您在將SSL憑證與資料來源搭配使用時出現存取遭拒的錯誤,請確定您的 IAM role 具有在其指定位置存取SSL憑證檔案的權限。如果憑證使用 AWS KMS 金鑰,您的 IAM 角色也應具有使用解密的權限 AWS KMS 索引鍵。如需詳細資訊,請參閱的驗證和存取控制 AWS KMS.

我在使用 SharePoint 資料來源時收到授權錯誤

如果您在同步索引與 SharePoint 資料來源時收到授權錯誤,請確認您在中指派了網站管理員角色 SharePoint。

我的索引不會從我的匯合資料來源抓取文件

如果您的 Amazon Kendra 索引不會在同步處理過程中從 Confluence 資料來源檢索文件,請確認您是 Confluence 中的管理員群組的一部分。