

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立資料來源連接器
<a name="data-source"></a>

您可以為 建立資料來源連接器 Amazon Kendra ，以連線至 文件並編製索引。 Amazon Kendra 可以連線至 Microsoft SharePoint、Google Drive 和許多其他供應商。當您建立資料來源連接器時，您會提供連線至來源儲存庫所需的 Amazon Kendra 組態資訊。與將文件直接新增至索引不同，您可以定期掃描資料來源以更新索引。

例如，假設您有存放在 Amazon S3 儲存貯體中的稅務文件儲存庫。現有文件會不時變更，並將新文件新增至儲存庫。如果您將儲存庫新增至 Amazon Kendra 做為資料來源，您可以透過設定資料來源和索引之間的定期同步，讓索引保持最新狀態。

您可以選擇使用主控台或 [StartDataSourceSyncJob](https://docs.aws.amazon.com/kendra/latest/APIReference/API_StartDataSourceSyncJob.html) API 手動更新索引。否則，您可以設定排程來更新索引，並讓它與您的資料來源同步。

索引可以有多個資料來源。每個資料來源都可以有自己的更新排程。例如，您可以每天或甚至每小時更新工作文件的索引，同時每當封存變更時手動更新封存文件。

如果您想要在文件擷取程序期間變更文件中繼資料或屬性和內容，請參閱[Amazon Kendra 自訂文件擴充](https://docs.aws.amazon.com/kendra/latest/dg/custom-document-enrichment.html)。

**注意**  
每個文件 ID 在每個索引中必須是唯一的。您無法建立資料來源以使用其唯一 IDs為文件編製索引，然後使用 `BatchPutDocument` API 為相同的文件編製索引，反之亦然。您可以刪除資料來源，然後使用 `BatchPutDocument` API 為相同的文件編製索引，反之亦然。將 `BatchPutDocument`和 `BatchDeleteDocument` APIs與同一組文件的 Amazon Kendra 資料來源連接器結合使用，可能會導致資料不一致。反之，我們建議您使用[Amazon Kendra 自訂資料來源連接器](https://docs.aws.amazon.com/kendra/latest/dg/data-source-custom.html)。

**注意**  
新增至索引的檔案必須位於 UTF-8 編碼的位元組串流中。如需 中文件的詳細資訊 Amazon Kendra，請參閱 [文件](https://docs.aws.amazon.com/kendra/latest/dg/hiw-documents.html)。

## 設定更新排程
<a name="cron"></a>

將資料來源設定為使用 主控台或在建立或更新資料來源時使用 `Schedule` 參數定期更新。參數的內容是包含 `cron`- 格式排程字串或空字串的字串，以指出索引會隨需更新。如需 cron 表達式的格式，請參閱*Amazon CloudWatch Events 《 使用者指南*》中的[規則排程表達式](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html)。 僅 Amazon Kendra 支援 cron 表達式。它不支援速率表達式。

## 設定語言
<a name="language"></a>

您可以使用支援的語言，為資料來源中的所有文件編製索引。當您呼叫 [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html) 時，您可以為資料來源中的所有文件指定語言代碼。如果文件沒有中繼資料欄位中指定的語言代碼，則會使用資料來源層級為所有文件指定的語言代碼來編製文件索引。如果您未指定語言， Amazon Kendra 預設會以英文為資料來源中的文件編製索引。如需支援語言的詳細資訊，包括其代碼，請參閱[以英文以外的語言新增文件](https://docs.aws.amazon.com/kendra/latest/dg/in-adding-languages.html)。

您可以使用 主控台，以支援的語言為資料來源中的所有文件編製索引。如果您要**新增****資料來源，請前往資料來源**並編輯資料來源或新增資料來源。在**指定資料來源詳細資訊**頁面上，從下拉式語言中選擇**語言**。您選取**更新**或繼續輸入組態資訊以連線至資料來源。