翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データソースフィールドのマッピング
Amazon Kendra データソースコネクタは、ドキュメントフィールドまたはコンテンツフィールドをデータソースから Amazon Kendra インデックスのフィールドにマッピングできます。デフォルトでは、各コネクタは特定のデータソースフィールドをクロールするように設計されています。既定のデータソースフィールドとそのプロパティは変更またはカスタマイズできません。 Amazon Kendra コンソールでは、編集できないデフォルトのフィールドとデフォルトのフィールドプロパティはグレー表示されます。
Amazon Kendra コネクタを使用すると、データソースのカスタムドキュメントまたはコンテンツフィールドをインデックスのカスタムフィールドにマッピングすることもできます。例えば、データソースにドキュメントの部門情報を含む「dept」というフィールドがある場合、それを「Department」というインデックスフィールドにマッピングできます。そうすれば、ドキュメントをクエリするときにフィールドを使用できます。
などの Amazon Kendra 予約済みフィールドや共通フィールドをマッピングすることもできます_created_at
。データソースに「creation_date」というフィールドがある場合は、これを という同等の Amazon Kendra 予約済みフィールドにマッピングできます_created_at
。 Amazon Kendra 予約済みフィールドの詳細については、「ドキュメント属性またはフィールド」を参照してください。
ほとんどのデータソースのフィールドをマッピングできます。次のデータソースのフィールドマッピングを作成できます。
-
Adobe Experience Manager
-
Alfresco
-
Aurora (MySQL)
-
Aurora (PostgreSQL)
-
Amazon FSx (Windows)
-
Amazon FSx (NetApp ONTAP)
-
Amazon RDS/Aurora
-
Amazon RDS (Microsoft SQL Server)
-
Amazon RDS (MySQL)
-
Amazon RDS (Oracle)
-
Amazon RDS (PostgreSQL)
-
Amazon Kendra ウェブクローラー
-
Amazon WorkDocs
-
[Box] (ボックス)
-
Confluence
-
Dropbox
-
Drupal
-
GitHub
-
Google Workspace ドライブ
-
Gmail
-
IBM DB2
-
Jira
-
Microsoft Exchange
-
Microsoft OneDrive
-
Microsoft SharePoint
-
Microsoft Teams
-
Microsoft SQL Server
-
Microsoft Yammer
-
MySQL
-
Oracle Database
-
PostgreSQL
-
Quip
-
Salesforce
-
ServiceNow
-
Slack
-
Zendesk
S3 バケットまたは S3 データソースにドキュメントを保存する場合、JSON メタデータファイルを使用してフィールドを指定します。詳細については、「S3 data source connector」を参照してください。
データソースフィールドをインデックスフィールドにマッピングするには、次の 3 つの手順を実行します。
-
インデックスを作成します。詳細については、インデックスの作成を参照してください。
-
インデックスを更新して、フィールドを追加します。
-
データソースを作成し、フィールドマッピングを含めて、予約済みフィールドとカスタムフィールドを Amazon Kendra インデックスフィールドにマッピングします。
インデックスを更新してカスタムフィールドを追加するには、コンソールを使用してデータソースフィールドマッピングを編集し、カスタムフィールドを追加するか、UpdateIndex API を使用します。合計 500 のカスタムフィールドをインデックスに追加できます。
データベースデータソースの場合、データベース列の名前が予約フィールドの名前と一致する場合、フィールドと列は自動的にマッピングされます。
UpdateIndex API では、DocumentMetadataConfigurationUpdates
を使用して予約済みフィールドとカスタムフィールドを追加します。
次の JSON の例では、DocumentMetadataConfigurationUpdates
を使用して「Department」というフィールドをインデックスに追加します。
"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]
フィールドを作成するときに、検索でのフィールドの使用方法を設定するオプションがあります。次から選択できます。
-
表示可能 - クエリレスポンスでフィールドを返すかどうかを指定します。デフォルト:
true
。 -
ファセット可能 - フィールドを使用してファセットを作成できることを示します。デフォルト:
false
。 -
検索可能 - 検索でフィールドを使用するかどうかを指定します。デフォルトは、文字列フィールドに対しては
true
、数値フィールドと日付フィールドに対してはfalse
です。 -
ソート可能 - フィールドを使用して検索結果をソートできることを示します。日付、数値、および文字列フィールドに対してのみ設定できます。文字列リストフィールドには設定できません。
次の JSON 例では、DocumentMetadataConfigurationUpdates
を使用して「Department」というフィールドをインデックスに追加し、それをファセット可能としてマークします。
"DocumentMetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE", "Search": { "Facetable": true } } ]
Amazon Kendra 予約済みまたは共通ドキュメントフィールドの使用
UpdateIndex API では、DocumentMetadataConfigurationUpdates
を使用して Amazon Kendra
予約済みインデックスフィールド名を指定することにより、予約フィールドまたは共通フィールドを作成し、対応するドキュメント属性/フィールド名にマッピングできます。カスタムフィールドも作成できます。データソースコネクタを使用する場合、データソースドキュメントフィールドを Amazon Kendra インデックスフィールドにマッピングするフィールドマッピングがほとんど含まれます。コンソールを使用する場合は、データソースを選択し、編集アクションを選択してから、フィールドマッピングセクションの横に進んでデータソースを設定して、フィールドを更新します。
Search
オブジェクトを設定して、フィールドを表示可能、ファセット可能、検索可能、ソート可能のいずれかに設定できます。特定のフィールド値にマッピングされたブースト、新しさ、重要度の値に適用するフィールドのランク順序、ブースト期間、または期間を設定するように Relevance
オブジェクトを設定できます。コンソールを使用する場合は、ナビゲーションメニューのファセットオプションを選択して、フィールドの検索設定をセットできます。関連性調整を設定するには、ナビゲーションメニューでインデックスを検索するオプションを選択し、クエリを入力し、サイドパネルのオプションを使用して検索の関連性を調整します。フィールドを作成すると、フィールドタイプを変更することはできません。
Amazon Kendra には、使用できる以下の予約済みまたは共通ドキュメントフィールドがあります。
-
_authors
- ドキュメントの内容を担当する 1 人以上の作成者のリスト。 -
_category
- ドキュメントを特定のグループに配置するカテゴリ。 -
_created_at
- ドキュメントが作成された ISO 8601 形式の日付と時刻。例えば、2012-03-25T12:30:10+01:00 は、中央ヨーロッパ時間の 2012 年 3 月 25 日午後 12 時 30 分 (プラス 10 秒) の ISO 8601 の日付/時刻形式です。 -
_data_source_id
- ドキュメントを含むデータソースの識別子。 -
_document_body
- ドキュメントのコンテンツ。 -
_document_id
- ドキュメントの一意の識別子。 -
_document_title
- ドキュメントのタイトル。 -
_excerpt_page_number
- ドキュメントの抜粋が表示される PDF ファイルのページ番号。2020 年 9 月 8 日より前にインデックスが作成された場合、この属性を使用する前に、ドキュメントのインデックスを再作成する必要があります。 -
_faq_id
- これが質疑応答タイプのドキュメント (よくある質問) の場合、よくある質問の固有識別子です。 -
_file_type
- pdf や doc など、ドキュメントのファイルタイプ。 -
_last_updated_at
- ドキュメントが最後に更新された ISO 8601 形式の日付と時刻。例えば、2012-03-25T12:30:10+01:00 は、中央ヨーロッパ時間の 2012 年 3 月 25 日午後 12 時 30 分 (プラス 10 秒) の ISO 8601 の日付/時刻形式です。 -
_source_uri
- ドキュメントが利用可能な URI。例えば、会社のウェブサイト上のドキュメントの URI などです。 -
_version
- ドキュメントの特定のバージョンの識別子。 -
_view_count
- ドキュメントが表示された回数。 -
_language_code
(文字列) - ドキュメントに適用される言語のコード。言語を指定しないと、デフォルトで英語になります。コードを含む、サポートされている言語の詳細については、英語以外の言語でドキュメントを追加するを参照してください。
カスタムフィールドの場合、予約フィールドまたは共通フィールドを作成する場合と同じように、UpdateIndex
API で DocumentMetadataConfigurationUpdates
を使用してこれらのフィールドを作成します。カスタムフィールドには適切なデータタイプを設定する必要があります。コンソールを使用する場合は、データソースを選択し、編集アクションを選択してから、フィールドマッピングセクションの横に進んでデータソースを設定して、フィールドを更新します。一部のデータソースは、新しいフィールドやカスタムフィールドの追加をサポートしていません。フィールドを作成すると、フィールドタイプを変更することはできません。
カスタムフィールドには以下のタイプを設定できます。
-
日付
-
数値
-
String
-
文字列リスト
BatchPutDocument API を使用してインデックスにドキュメントを追加した場合、Attributes
は、ドキュメントのフィールド/属性を一覧表示し、DocumentAttribute
オブジェクトを使用してフィールドを作成します。
Amazon S3 データソースからインデックス作成されたドキュメントの場合、フィールド情報を含む JSON メタデータファイルを使用してフィールドを作成します。
サポートされているデータベースをデータソースとして使用する場合は、フィールドマッピングオプションを使用してフィールドを設定できます。