對資料來源進行故障診斷 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

對資料來源進行故障診斷

本節可協助您解決設定和使用 Amazon Kendra 資料來源連接器時的常見問題。

我的文件未編製索引

當您將 Amazon Kendra 索引與資料來源同步時,可能會遇到防止文件編製索引的問題。索引是兩步驟程序。首先,會檢查資料來源是否有新的和更新的要編製索引的文件,並尋找要從索引中移除的文件。其次,在文件層級,存取每個文件並編製索引。

其中一個步驟都可能發生錯誤。資料來源層級錯誤會在 主控台的資料來源詳細資訊頁面的同步執行歷史記錄區段中回報。同步任務的狀態可以成功未完成失敗。您也可以查看在任務期間編製索引和刪除的文件數量。如果狀態為失敗詳細資訊欄中會顯示訊息。

文件層級錯誤會回報於 中 Amazon CloudWatch Logs。您可以使用 CloudWatch 主控台查看錯誤。

若要產生文件同步狀態報告,請參閱我想要為我的文件產生同步狀態報告

我的同步任務失敗

當索引或資料來源發生組態錯誤時,同步任務通常會失敗。在 主控台中,您可以在資料來源詳細資訊頁面的同步執行歷史記錄區段中,於詳細資訊欄下找到錯誤訊息。文件層級錯誤會在 中報告 Amazon CloudWatch Logs。錯誤訊息會提供錯誤的相關資訊。問題通常是索引或資料來源沒有適當的 IAM 許可。錯誤訊息說明缺少的許可。以下是您可以接收的一些錯誤訊息:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

如果您的索引角色沒有使用許可 CloudWatch,資料來源將無法建立 CloudWatch 日誌。如果您收到此錯誤,則必須將 CloudWatch 許可新增至索引角色。

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

當您使用 Amazon S3 資料來源時, Amazon Kendra 必須具有存取包含文件之儲存貯體的許可。您需要新增 許可 Amazon Kendra ,才能將儲存貯體讀取至資料來源 IAM 角色。

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra 需要許可才能擔任索引和資料來源 IAM 角色。您需要將信任政策新增至具有 sts:AssumeRole動作許可的角色。

如需索引資料來源 Amazon Kendra 所需的 IAM 政策,請參閱 IAM 角色

若要產生文件同步狀態報告,請參閱我想要為我的文件產生同步狀態報告

我的同步任務不完整

當任務完成資料來源層級程序,但在文件層級程序中出現一些錯誤時,通常未完成。當任務未完成時,有些文件可能尚未成功編製索引。對於 Amazon S3 資料來源,未完成的任務通常是由以下原因造成:

  • 一或多個文件的中繼資料無效。

  • 當文件提交索引,但至少有一個文件未提交時。

  • 提交要從索引刪除的文件,但至少尚未提交一份文件時。

若要對未完成的同步任務進行故障診斷,請先查看您的 CloudWatch 日誌。

  1. 在詳細資訊欄中,選擇檢視詳細資訊 CloudWatch

  2. 檢閱錯誤訊息,以查看文件失敗的原因。

若要產生文件同步狀態報告,請參閱我想要為我的文件產生同步狀態報告

我的同步任務成功,但沒有索引文件

索引同步任務執行偶爾會標示為成功,但預期不會有新的或更新的文件編製索引。可能的原因包括:

  • 檢查 CloudWatch DocumentsSubmittedForIndexingFailed指標,查看是否有任何文件無法同步。如需詳細資訊,請檢查您的 CloudWatch 日誌。

  • 對於 Amazon S3 資料來源,您可能給了 Amazon Kendra 錯誤的儲存貯體名稱或字首。請確定 Amazon Kendra 使用的 儲存貯體是包含要編製索引的文件的儲存貯體。

  • 為無法在較早任務中編製索引的文件重新編製索引時,除非您已變更文件或其相關聯的中繼資料檔案,否則 Amazon Kendra 不會編製索引。

若要產生文件同步狀態報告,請參閱我想要為我的文件產生同步狀態報告

我在同步資料來源時遇到檔案格式問題

如果您在將檔案新增至資料來源或同步資料來源時遇到檔案格式問題,請確定您的文件類型受到 Amazon Kendra 支援。如需 支援的文件類型清單, Amazon Kendra 請參閱 文件類型或格式

如果您使用 BatchPutDocument API 搭配純文字檔案,請指定 PLAIN_TEXT做為內容類型。

我想要為我的文件產生同步歷史記錄報告

您可以透過選取檢視報告,在 CloudWatch 中檢視資料來源同步任務的文件層級同步執行歷史記錄報告。同步執行歷史記錄報告將提供有關同步任務中每個文件的進度和狀態的詳細資訊。它會顯示文件在爬蟲、同步和索引階段期間是否成功、失敗或遭到略過。您也可以找到與失敗或略過文件相關的任何錯誤訊息。如果報告未顯示進行中同步任務的結果,則日誌可能尚無法使用。當資料在同步過程中發生事件時,請稍後再回來查看。

若要存取同步執行歷史記錄報告,請執行下列步驟:

  1. https://console.aws.amazon.com/kendra/:// 開啟 Amazon Kendra 主控台。

  2. 在左側導覽選單的資料管理下,選擇資料來源,然後選擇您的資料來源。

  3. 從您的資料來源摘要頁面中,向下捲動並選取同步歷史記錄索引標籤。

  4. 同步執行歷史記錄中,選取動作

  5. 動作中,選取檢視報告。系統會將您重新導向至 CloudWatch 主控台,您可以在其中存取您的報告。

注意

如果文件在擷取期間成功編製索引,包括連接 ACLs和中繼資料,則同步執行歷史記錄會記錄所有 Amazon Kendra 支援的連接器。

如果您使用的是 Amazon S3 連接器:

除了在 CloudWatch 中擷取文件層級同步執行歷史記錄報告之外,您還可以為 Amazon S3 資料來源中的每個文件產生同步歷史記錄報告,並將其複製到 Amazon S3 儲存貯體。在此過程中,您的資料會使用 AWS KMS 金鑰加密,而且只能由您檢視。報告的文件狀態可以是下列其中一項:失敗已完成成功並發生錯誤。您必須先執行下列動作,才能產生 Amazon S3 的同步狀態報告:

  • 將下列 Amazon Kendra 服務主體新增至您的 Amazon S3 存取政策

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • 建立具有 存取許可的 儲存 Amazon S3 貯體 Amazon Kendra

如果您使用 主控台,若要產生 Amazon S3 的同步歷史記錄報告,請選擇從資料來源詳細資訊頁面上的同步歷史記錄報告 – 選用區段中啟用產生報告選項。然後,輸入儲存貯體 Amazon S3 位置,然後從可用的組態選項中進行選擇。在您啟用產生報告之後,報告會從下一次同步產生。

如果您刪除儲存 Amazon S3 貯體,您會遺失日誌資料,而且必須設定新的儲存貯體來存放新的同步報告。

注意

同步歷史記錄報告僅提供有關 Amazon S3 連接器是否成功爬取和擷取資料的資訊。

同步資料來源需要多少時間?

如果文件沒有更新,則 Amazon Kendra 索引的同步時間會以線性比例增加至文件數量。例如,1,000 份未進行任何更新的文件需要約五分鐘的時間進行同步,而 2,000 份未進行任何更新的文件則需要約 10 分鐘的時間。如果文件有任何更新,則同步時間會根據更新的文件數量而增加。

同步資料來源的費用是多少?

當您同步索引時,需要兩分鐘的時間來暖機並啟用 Amazon EC2 來建立必要的連線。在此過程中,您不需要付費。您的用量計只會在同步任務開始後開始。如需 Amazon Kendra 定價的詳細資訊,請參閱Amazon Kendra 定價

我收到 Amazon EC2 授權錯誤

如果在虛擬私有雲端 (VPC) 資料來源的同步期間發生 Amazon EC2 未經授權的操作錯誤,您的 VPC IAM 角色可能缺少必要的許可。請檢查您用於資料來源 IAM 的角色是否具有連接的許可。如需詳細資訊,請參閱虛擬私有雲端 IAM 角色

您的 Amazon Kendra 索引只能存取 Amazon S3 資料來源授予其存取許可的檔案。例如, Amazon Kendra 無法修改判斷物件是公有還是加密的 Amazon S3 許可。 Amazon Kendra 也沒有預設許可來建立或傳回 Amazon S3 物件的已簽署連結。如果您想要為 Amazon Kendra 索引中的 Amazon S3 物件啟用簽章連結,您有兩個選項:

  • 您可以將索引查詢結果與來源 uri 物件搭配使用簽署,再將結果傳回至搜尋頁面。如需此程序的step-by-step演練,請參閱使用預先簽章URLs 共享物件

  • 您可以覆寫 Amazon S3 物件中繼資料來源 uri,並透過連線至 Amazon S3 儲存貯體 CloudFront 的內容交付網路 (CDN) 提供您的服務。或者,您可以使用傳回預先簽章 URL 並將其重新導向的 API Gateway 代理端點。

我在使用 SSL 憑證檔案錯誤訊息時收到 AccessDenied

如果您在搭配資料來源使用 SSL 憑證時收到存取遭拒的錯誤,請確定您的 IAM 角色具有在其指定位置存取 SSL 憑證檔案的許可。如果憑證使用 AWS KMS 金鑰加密,您的 IAM 角色也應該具有使用 AWS KMS 金鑰解密的許可。如需詳細資訊,請參閱 的身分驗證和存取控制 AWS KMS

使用 SharePoint 資料來源時收到授權錯誤

如果您在與 SharePoint 資料來源同步索引時收到授權錯誤,請確認您在 SharePoint 中已指派 Site Admin 角色給您。

我的索引不會從 Confluence 資料來源中擷取文件

如果您的 Amazon Kendra 索引未在同步程序中從 Confluence 資料來源爬取文件,請確認您是 Confluence 中的管理員群組的一部分。