Amazon WorkDocs - Amazon Kendra

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon WorkDocs

Amazon WorkDocs は、コンテンツを作成、編集、保存、共有するための安全なコンテンツコラボレーションサービスです。を使用して Amazon Kendra データソースのインデックスを作成できます Amazon WorkDocs 。

Amazon Kendra コンソールWorkDocsConfiguration API を使用して Amazon WorkDocs データソース Amazon Kendra に接続できます。

Amazon WorkDocs は、オレゴン、バージニア北部、シドニー、シンガポール、アイルランドの各リージョンで利用できます。

Amazon Kendra WorkDocs データソースコネクタのトラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング

サポートされている機能

Amazon Kendra WorkDocs データソースコネクタは、次の機能をサポートしています。

  • フィールドマッピング

  • ユーザーアクセスコントロール

  • 包含/除外フィルター

  • 変更ログ

前提条件

を使用して WorkDocs データソース Amazon Kendra のインデックスを作成する前に、 WorkDocs および AWS アカウントでこれらの変更を行います。

で WorkDocs、以下があることを確認します。

  • Amazon WorkDocs リポジトリの Amazon WorkDocs ディレクトリ ID (組織 ID) を記録しました。

  • 各ドキュメントが WorkDocs 、同じインデックスに使用する予定の他のデータソース間で一意であることを確認しました。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。

AWS アカウントで、以下があることを確認します。

既存の IAM ロールがない場合は、 WorkDocs データソースを に接続するときに、コンソールを使用して新しい IAM ロールを作成できます Amazon Kendra。API を使用している場合は、既存の IAM ロールの ARN とインデックス ID を指定する必要があります。

接続手順

WorkDocs データソース Amazon Kendra に接続するには、 が WorkDocs データ Amazon Kendra にアクセスできるように、データソースの必要な詳細を入力する必要があります。にまだ を設定していない場合は Amazon Kendra、 WorkDocs 「」を参照してください前提条件

Console

Amazon Kendra に接続するには Amazon WorkDocs

  1. にサインイン AWS Management Console し、Amazon Kendra コンソール を開きます。

  2. 左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。

    注記

    [インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。

  3. [使用開始] ページで、[データソースを追加] を選択します。

  4. データソースの追加ページで、WorkDocs コネクタ を選択し、コネクタの追加 を選択します。バージョン 2 (該当する場合) を使用している場合は、「V2.0」タグが付いたWorkDocs コネクタを選択します。

  5. [データソースの詳細を指定] ページで、次の情報を入力します。

    1. [名前と説明][データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。

    2. (オプション) [説明] - オプションで、データソースの説明を入力します。

    3. デフォルト言語 - ドキュメントをフィルタリングしてインデックスを作成する言語を選択します。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。

    4. タグ で、新しいタグを追加 — リソースを検索およびフィルタリングしたり、 AWS コストを追跡したりするためのオプションのタグを含めます。

    5. [次へ] をクリックします。

  6. [アクセスとセキュリティの定義] ページで、次の情報を入力します。

    1. Amazon WorkDocs サイトに固有の組織 ID — インデックスを作成する Amazon WorkDocs サイトの ID を選択します。あらかじめサイトを作成しておく必要があります。

    2. IAM ロール — 既存の IAM ロールを選択するか、新しい IAM ロールを作成してリポジトリ認証情報にアクセスし、コンテンツにインデックスを作成します。

      注記

      IAM インデックスに使用される ロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。

    3. [次へ] をクリックします。

  7. [同期設定の構成] ページで、次の情報を入力します。

    1. クロールドキュメントコメント - Amazon WorkDocs クロールするエンティティまたはコンテンツタイプ。

    2. 変更ログを使用する — すべてのファイルを同期するのではなく、新規または変更されたコンテンツのみでインデックスを更新する場合に選択します。

    3. [正規表現パターン] - 特定のファイルを含めるまたは除外する正規表現パターン。

    4. Sync run schedule for Frequency — データソースコンテンツを同期し、インデックスを更新する頻度を選択します。

    5. [次へ] をクリックします。

  8. [フィールドマッピングを設定] ページで、次の情報を入力します。

    1. デフォルトのデータソースフィールド — インデックスにマッピングする Amazon Kendra 生成されたデフォルトのデータソースフィールドから選択します。

    2. [フィールドを追加] - カスタムデータソースフィールドを追加して、マッピング先のインデックスフィールド名とフィールドデータタイプを作成します。

    3. [次へ] をクリックします。

  9. [確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。

API

Amazon Kendra に接続するには Amazon WorkDocs

WorkDocsConfiguration API を使用して以下を指定する必要があります。

  • Amazon WorkDocs ディレクトリ ID — Amazon WorkDocs ディレクトリの組織 ID を指定します。組織 ID は、[アクティブディレクトリ][ディレクトリ] の順で移動して、AWS Directory Service で確認できます。

  • IAM ロール - を呼び出しCreateDataSourceて、ダーティクトリーにアクセス WorkDocsするためのアクセス許可を IAM ロールに提供し、 WorkDocs コネクタと に必要なパブリック APIs を呼び出すRoleArnタイミングを指定します Amazon Kendra。詳細については、 WorkDocs 「データソースの IAM ロール」を参照してください。

オプションで、次の機能を追加することもできます。

  • 変更ログ — が WorkDocs データソース変更ログメカニズム Amazon Kendra を使用して、インデックスでドキュメントを更新する必要があるかどうかを判断する必要があるかどうか。

    注記

    Amazon Kendra にすべてのドキュメントをスキャンさせない場合は、変更ログを使用します。変更ログが大きい場合、 WorkDocs 変更ログを処理するよりも、データソース内のドキュメントのスキャンにかかる時間が Amazon Kendra 短くなることがあります。データソースを WorkDocsインデックスに初めて同期する場合、すべてのドキュメントがスキャンされます。

  • 包含フィルターと除外フィルター - 特定のドキュメントとドキュメントコメントを含めるか除外するかを指定します。各コメントは、個別のドキュメントとしてインデックスが作成されます。

    注記

    ほとんどのデータソースは、フィルターと呼ばれる包含または除外パターンである正規表現パターンを使用しています。包含フィルターを指定すると、包含フィルターに一致するコンテンツのみのインデックスが作成されます。包含フィルターに一致しないドキュメントのインデックスは作成されません。包含フィルターと除外フィルターを指定した場合、除外フィルターに一致するドキュメントは、包含フィルターと一致してもインデックスは作成されません。

  • ユーザーコンテキストのフィルタリングとアクセスコントロール —Amazon Kendra ドキュメントの ACL がある場合は、ドキュメントのアクセスコントロールリスト (ACL) をクロールします。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。

  • フィールドマッピング — 選択すると、データソースフィールドを Amazon Kendra インデックスフィールドにマッピングします WorkDocs 。詳細については、データソースフィールドのマッピングを参照してください。

    注記

    がドキュメント Amazon Kendra を検索するには、ドキュメント本文フィールドまたはドキュメントと同等のドキュメント本文が必要です。データソースのドキュメント本文フィールド名をインデックスフィールド名 にマッピングする必要があります_document_body。その他のすべてのフィールドはオプションです。

詳細はこちら

Amazon Kendra とデータソースとの統合の詳細については WorkDocs 、以下を参照してください。