

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# データソースコネクタの作成
<a name="data-source"></a>

のデータソースコネクタを作成して Amazon Kendra 、ドキュメントに接続してインデックスを作成できます。 は、Microsoft SharePoint、Google Drive、およびその他の多くのプロバイダーに接続 Amazon Kendra できます。データソースコネクタを作成するときは、ソースリポジトリへの接続に必要な Amazon Kendra 設定情報を指定します。ドキュメントをインデックスに直接追加する場合とは異なり、データソースを定期的にスキャンしてインデックスを更新できます。

たとえば、 Amazon S3 バケットに保存されている税ドキュメントのリポジトリがあるとします。ときどき、既存のドキュメントが変更され、新しいドキュメントが随時リポジトリに追加されます。リポジトリをデータソース Amazon Kendra として に追加する場合、データソースとインデックス間の定期的な同期を設定することで、インデックスを最新の状態に保つことができます。

コンソールまたは [StartDataSourceSyncJob](https://docs.aws.amazon.com/kendra/latest/APIReference/API_StartDataSourceSyncJob.html) API を使用してインデックスを手動で更新することを選択できます。それ以外の場合は、インデックスを更新してデータソースと同期させるスケジュールを設定します。

インデックスには複数のデータソースを使用できます。各データソースには、独自の更新スケジュールを設定できます。例えば、アーカイブが変更されるたびに、アーカイブされたドキュメントを手動で更新しながら、作業中のドキュメントのインデックスを毎日更新したり、時間ごとに更新したりできます。

ドキュメント取り込みプロセス中にドキュメントメタデータまたは属性とコンテンツを変更する場合は、「[Amazon Kendra Custom Document Enrichment](https://docs.aws.amazon.com/kendra/latest/dg/custom-document-enrichment.html)」を参照してください。

**注記**  
それぞれのドキュメント ID はインデックスごとに一意である必要があります。一意の ID でドキュメントにインデックスを付けるデータソースを作成してから、`BatchPutDocument` API を使用して同じドキュメントにインデックスを付けることはできません。その逆も同様です。データソースを削除してから `BatchPutDocument` API を使用して同じドキュメントにインデックスを付けることができます。その逆も可能です。`BatchPutDocument` および `BatchDeleteDocument` APIs を同じドキュメントセットの Amazon Kendra データソースコネクタと組み合わせて使用すると、データとの不整合が発生する可能性があります。代わりに、[Amazon Kendra カスタムデータソースコネクタ](https://docs.aws.amazon.com/kendra/latest/dg/data-source-custom.html)の使用をお勧めします。

**注記**  
インデックスに追加されるファイルは、UTF-8 でエンコードされたバイトストリームに存在する必要があります。のドキュメントの詳細については Amazon Kendra、[「ドキュメント](https://docs.aws.amazon.com/kendra/latest/dg/hiw-documents.html)」を参照してください。

## 更新スケジュールの設定
<a name="cron"></a>

データソースを作成または更新するときに、コンソールか、または `Schedule` パラメータを使用して、データソースを定期的に更新するように構成します。パラメータの内容は、`cron` 形式スケジュール文字列、またはインデックスをオンデマンドで更新することを示す空の文字列のいずれかを保持する文字列です。cron 式の形式については、[「 ユーザーガイド」の「ルールのスケジュール式](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html)」を参照してください。 は cron 式のみ Amazon Kendra をサポートしています。 *Amazon CloudWatch Events *rate 式はサポートしていません。

## 言語設定
<a name="language"></a>

サポートされている言語で、データソース内のすべてのドキュメントにインデックスを作成できます。[CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html) を呼び出すときに、データソース内のすべてのドキュメントの言語コードを指定します。ドキュメントにメタデータフィールドで指定された言語コードがない場合、データソースレベルですべてのドキュメントに指定された言語コードを使用して、ドキュメントのインデックスが作成されます。言語を指定しない場合、 Amazon Kendra はデフォルトで英語でデータソースのドキュメントをインデックス作成します。コードを含む、サポートされている言語の詳細については、[英語以外の言語でドキュメントを追加する](https://docs.aws.amazon.com/kendra/latest/dg/in-adding-languages.html)を参照してください。

コンソールを使用するサポートされている言語で、データソース内のすべてのドキュメントにインデックスを作成できます。新しいデータソースを追加する場合、**[データソース]** に移動してデータソースを編集するか、**[データソースを追加]** します。**[Specify data source details]** (データソースの詳細を指定) ページで、**[Language]** (言語) のドロップダウンから言語を選択します。**Update** (更新) を選択するか、続けて構成情報を入力してデータソースに接続します。