選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

建立資料來源連接器

焦點模式
建立資料來源連接器 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

您可以為 建立資料來源連接器 Amazon Kendra ,以連線至 文件並編製索引。 Amazon Kendra 可以連線至 Microsoft SharePoint、Google Drive 和許多其他提供者。當您建立資料來源連接器時,您會提供連線至來源儲存庫所需的 Amazon Kendra 組態資訊。與將文件直接新增至索引不同,您可以定期掃描資料來源以更新索引。

例如,假設您有存放在 Amazon S3 儲存貯體中的稅務文件儲存庫。現有的文件會不時變更,並將新的文件新增至儲存庫。如果您將儲存庫新增至 Amazon Kendra 做為資料來源,您可以透過設定資料來源和索引之間的定期同步,讓索引保持最新狀態。

您可以選擇使用主控台或 StartDataSourceSyncJob API 手動更新索引。否則,您會設定排程來更新索引,並讓它與您的資料來源同步。

索引可以有多個資料來源。每個資料來源都可以有自己的更新排程。例如,您可以每天或甚至每小時更新工作文件的索引,同時每當封存變更時手動更新封存文件。

如果您想要在文件擷取過程中變更文件中繼資料或屬性和內容,請參閱Amazon Kendra 自訂文件擴充

注意

每個文件 ID 在每個索引必須是唯一的。您無法建立資料來源以使用其唯一 IDs為文件編製索引,然後使用 BatchPutDocument API 為相同的文件編製索引,反之亦然。您可以刪除資料來源,然後使用 BatchPutDocument API 為相同的文件編製索引,反之亦然。將 BatchPutDocumentBatchDeleteDocument APIs與同一組文件的 Amazon Kendra 資料來源連接器結合使用,可能會導致您的資料不一致。反之,我們建議您使用Amazon Kendra 自訂資料來源連接器

注意

新增至索引的檔案必須位於 UTF-8 編碼位元組串流中。如需 中文件的詳細資訊 Amazon Kendra,請參閱 文件

設定更新排程

設定您的資料來源以使用 主控台定期更新,或在建立或更新資料來源時使用 Schedule 參數。參數的內容是包含 cron- 格式排程字串或空字串的字串,以指出索引會隨需更新。如需 cron 表達式的格式,請參閱Amazon CloudWatch Events 《 使用者指南》中的規則排程表達式。 僅 Amazon Kendra 支援 cron 表達式。它不支援速率表達式。

設定語言

您可以將資料來源中的所有文件以支援的語言編製索引。當您呼叫 CreateDataSource 時,您可以指定資料來源中所有文件的語言代碼。如果文件沒有在中繼資料欄位中指定語言代碼,則會使用資料來源層級為所有文件指定的語言代碼來編製文件索引。如果您未指定語言, 預設 Amazon Kendra 會以英文為資料來源中的文件編製索引。如需支援語言的詳細資訊,包括其代碼,請參閱新增英文以外語言的文件

您可以使用 主控台,以支援的語言編製資料來源中所有文件的索引。如果您要新增資料來源,請前往資料來源並編輯資料來源或新增資料來源。在指定資料來源詳細資訊頁面上,從下拉式清單語言中選擇語言。您選取更新或繼續輸入組態資訊以連線至資料來源。

在本頁面

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。