Amazon Kendra は、2026 年 7 月 30 日以降、新規のお客様に公開されなくなります。サービスを使用する場合は、7 月 30 日までにサインアップしてください。同様の機能については Amazon Kendra、Amazon Bedrock ナレッジベースを参照してください。詳細はこちら。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データソースフィールドのマッピング

Amazon Kendra データソースコネクタは、ドキュメントまたはコンテンツフィールドをデータソースから Amazon Kendra インデックスのフィールドにマッピングできます。デフォルトでは、各コネクタは特定のデータソースフィールドをクロールするように設計されています。既定のデータソースフィールドとそのプロパティは変更またはカスタマイズできません。 Amazon Kendra コンソールでは、編集できないデフォルトのフィールドとデフォルトのフィールドプロパティはグレー表示されます。

Amazon Kendra コネクタを使用すると、データソースのカスタムドキュメントまたはコンテンツフィールドをインデックスのカスタムフィールドにマッピングすることもできます。例えば、データソースにドキュメントの部門情報を含む「dept」というフィールドがある場合、それを「Department」というインデックスフィールドにマッピングできます。そうすれば、ドキュメントをクエリするときにフィールドを使用できます。

などの Amazon Kendra リザーブドフィールドまたは共通フィールドをマッピングすることもできます_created_at。データソースに「creation_date」というフィールドがある場合は、これをという同等の Amazon Kendra 予約済みフィールドにマッピングできます_created_at。 Amazon Kendra 予約フィールドの詳細については、「ドキュメント属性またはフィールド」を参照してください。

ほとんどのデータソースのフィールドをマッピングできます。次のデータソースのフィールドマッピングを作成できます。

Adobe Experience Manager
Alfresco
Aurora (MySQL)
Aurora (PostgreSQL)
Amazon FSx (Windows)
Amazon FSx (NetApp ONTAP)
Amazon RDS/Aurora
Amazon RDS (Microsoft SQL Server)
Amazon RDS (MySQL)
Amazon RDS (Oracle)
Amazon RDS (PostgreSQL)
Amazon Kendra ウェブクローラー
WorkDocs
Box
Confluence
Dropbox
Drupal
GitHub
Google Workspace ドライブ
Gmail
IBM DB2
Jira
Microsoft Exchange
Microsoft OneDrive
Microsoft SharePoint
Microsoft Teams
Microsoft SQL Server
Microsoft Yammer
MySQL
Oracle Database
[PostgreSQL]
Quip
Salesforce
ServiceNow
Slack
Zendesk

S3 バケットまたは S3 データソースにドキュメントを保存する場合、JSON メタデータファイルを使用してフィールドを指定します。詳細については、「S3 data source connector」を参照してください。

データソースフィールドをインデックスフィールドにマッピングするには、次の 3 つの手順を実行します。

インデックスを作成します。詳細については、インデックスの作成を参照してください。
インデックスを更新して、フィールドを追加します。
データソースを作成し、リザーブドフィールドとカスタムフィールドを Amazon Kendra インデックスフィールドにマッピングするフィールドマッピングを含めます。

インデックスを更新してカスタムフィールドを追加するには、コンソールを使用してデータソースフィールドマッピングを編集し、カスタムフィールドを追加するか、UpdateIndex API を使用します。合計 500 のカスタムフィールドをインデックスに追加できます。

データベースデータソースの場合、データベース列の名前が予約フィールドの名前と一致する場合、フィールドと列は自動的にマッピングされます。

UpdateIndex API では、DocumentMetadataConfigurationUpdates を使用して予約済みフィールドとカスタムフィールドを追加します。

次の JSON の例では、DocumentMetadataConfigurationUpdates を使用して「Department」というフィールドをインデックスに追加します。


"DocumentmetadataConfigurationUpdates": [
   {
       "Name": "Department",
       "Type": "STRING_VALUE"
   }
]

フィールドを作成するときに、検索でのフィールドの使用方法を設定するオプションがあります。次から選択できます。

表示可能 - クエリレスポンスでフィールドを返すかどうかを指定します。デフォルトは true です。
ファセット可能 - フィールドを使用してファセットを作成できることを示します。デフォルトは false です。
検索可能 - 検索でフィールドを使用するかどうかを指定します。デフォルトは、文字列フィールドに対しては true、数値フィールドと日付フィールドに対しては false です。
ソート可能 - フィールドを使用して検索結果をソートできることを示します。日付、数値、および文字列フィールドに対してのみ設定できます。文字列リストフィールドには設定できません。

次の JSON 例では、DocumentMetadataConfigurationUpdates を使用して「Department」というフィールドをインデックスに追加し、それをファセット可能としてマークします。


"DocumentMetadataConfigurationUpdates": [
   {
       "Name": "Department",
       "Type": "STRING_VALUE",
       "Search": {
           "Facetable": true
       }
   }
]

Amazon Kendra 予約済みまたは共通ドキュメントフィールドの使用

UpdateIndex API では、DocumentMetadataConfigurationUpdates を使用して Amazon Kendra 予約済みインデックスフィールド名を指定することにより、予約フィールドまたは共通フィールドを作成し、対応するドキュメント属性/フィールド名にマッピングできます。カスタムフィールドも作成できます。データソースコネクタを使用する場合、データソースドキュメントフィールドを Amazon Kendra インデックスフィールドにマッピングするフィールドマッピングがほとんど含まれます。コンソールを使用する場合は、データソースを選択し、編集アクションを選択してから、フィールドマッピングセクションの横に進んでデータソースを設定して、フィールドを更新します。

Search オブジェクトを設定して、フィールドを表示可能、ファセット可能、検索可能、ソート可能のいずれかに設定できます。特定のフィールド値にマッピングされたブースト、新しさ、重要度の値に適用するフィールドのランク順序、ブースト期間、または期間を設定するように Relevance オブジェクトを設定できます。コンソールを使用する場合は、ナビゲーションメニューのファセットオプションを選択して、フィールドの検索設定をセットできます。関連性調整を設定するには、ナビゲーションメニューでインデックスを検索するオプションを選択し、クエリを入力し、サイドパネルのオプションを使用して検索の関連性を調整します。フィールドを作成すると、フィールドタイプを変更することはできません。

Amazon Kendra には、使用できる以下の予約済みまたは共通ドキュメントフィールドがあります。

_authors - ドキュメントの内容を担当する 1 人以上の作成者のリスト。
_category - ドキュメントを特定のグループに配置するカテゴリ。
_created_at - ドキュメントが作成された ISO 8601 形式の日付と時刻。例えば、2012-03-25T12:30:10+01:00 は、中央ヨーロッパ時間の 2012 年 3 月 25 日午後 12 時 30 分 (プラス 10 秒) の ISO 8601 の日付/時刻形式です。
_data_source_id - ドキュメントを含むデータソースの識別子。
_document_body - ドキュメントのコンテンツ。
_document_id - ドキュメントの一意の識別子。
_document_title - ドキュメントのタイトル。
_excerpt_page_number - ドキュメントの抜粋が表示される PDF ファイルのページ番号。2020 年 9 月 8 日より前にインデックスが作成された場合、この属性を使用する前に、ドキュメントのインデックスを再作成する必要があります。
_faq_id - これが質疑応答タイプのドキュメント (よくある質問) の場合、よくある質問の固有識別子です。
_file_type - pdf や doc など、ドキュメントのファイルタイプ。
_last_updated_at - ドキュメントが最後に更新された ISO 8601 形式の日付と時刻。例えば、2012-03-25T12:30:10+01:00 は、中央ヨーロッパ時間の 2012 年 3 月 25 日午後 12 時 30 分 (プラス 10 秒) の ISO 8601 の日付/時刻形式です。
_source_uri - ドキュメントが利用可能な URI。例えば、会社のウェブサイト上のドキュメントの URI などです。
_version - ドキュメントの特定のバージョンの識別子。
_view_count - ドキュメントが表示された回数。
_language_code (文字列) - ドキュメントに適用される言語のコード。言語を指定しないと、デフォルトで英語になります。コードを含む、サポートされている言語の詳細については、英語以外の言語でドキュメントを追加するを参照してください。

カスタムフィールドの場合、予約フィールドまたは共通フィールドを作成する場合と同じように、UpdateIndex API で DocumentMetadataConfigurationUpdates を使用してこれらのフィールドを作成します。カスタムフィールドには適切なデータタイプを設定する必要があります。コンソールを使用する場合は、データソースを選択し、編集アクションを選択してから、フィールドマッピングセクションの横に進んでデータソースを設定して、フィールドを更新します。一部のデータソースは、新しいフィールドやカスタムフィールドの追加をサポートしていません。フィールドを作成すると、フィールドタイプを変更することはできません。

カスタムフィールドには以下のタイプを設定できます。

日付
Number
String
文字列リスト

BatchPutDocument API を使用してインデックスにドキュメントを追加した場合、Attributes は、ドキュメントのフィールド/属性を一覧表示し、DocumentAttribute オブジェクトを使用してフィールドを作成します。

Amazon S3 データソースからインデックス付けされたドキュメントの場合、フィールド情報を含む JSON メタデータファイルを使用してフィールドを作成します。

サポートされているデータベースをデータソースとして使用する場合は、フィールドマッピングオプションを使用してフィールドを設定できます。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

Zendesk

英語以外の言語でドキュメントを追加する