翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Google Drive コネクタ V1.0
Google Drive はクラウドベースのファイルストレージサービスです。を使用して Amazon Kendra 、Google Drive データソースの共有ドライブ、My Drives、および Shared with me フォルダに保存されているドキュメントとコメントのインデックスを作成できます。Google WorkSpace のドキュメントと、ドキュメントのタイプに記載されているドキュメントにインデックスを作成できます。包含フィルターと除外フィルターを使用して、ファイル名、ファイルタイプ、ファイルパスでコンテンツにインデックスを作成することもできます。
注記
Google Drive コネクタ V1.0 / Google DriveConfiguration API は 2023 年に終了しました。Google Drive コネクタ V2.0/TemplateConfiguration API に移行するか、こちらを使用することをお勧めします。
Amazon Kendra Google Drive データソースコネクタのトラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング。
サポートされている機能
-
フィールドマッピング
-
ユーザーアクセスコントロール
-
包含/除外フィルター
前提条件
Amazon Kendra を使用して Google Drive データソースのインデックスを作成する前に、Google Drive と AWS アカウントでこれらの変更を行ってください。
Google Drive で以下を確認してください。
-
スーパー管理者ロールからアクセスを許可されているか、管理者権限を持つユーザーであるかのどちらかです。スーパー管理者ロールからアクセス許可を付与されている場合は、スーパー管理者ロールは必要ありません。
-
[G Suite ドメイン全体の委任を有効にする] を有効にしたサービスアカウントを作成し、そのアカウントを使用してプライベートキーとして JSON キーを作成しました。
-
ユーザーアカウント E メールとサービスアカウント E メールをコピーしました。に接続する Amazon Kendra ときは、ユーザーアカウントの E メールを管理者アカウントの E メールとして、サービスアカウントの E メールをクライアント E メールとして AWS Secrets Manager シークレットに入力します。
注記
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
-
管理者 SDK API と Google Drive API がアカウントに追加されました。
-
スーパー管理者ロールを使用して、以下のアクセス許可をサービスアカウントに追加しました (またはスーパー管理者ロールを持つユーザーに追加を依頼しました)。
-
https://www.googleapis.com/auth/drive.readonly
-
https://www.googleapis.com/auth/drive.metadata.readonly
-
https://www.googleapis.com/auth/admin.directory.user.readonly
-
https://www.googleapis.com/auth/admin.directory.group.readonly
-
-
各ドキュメントが Google Drive および同じインデックスを使用予定の他のデータソース間で一意であることが確認されていること。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。
で AWS アカウント、以下があることを確認します。
-
Amazon Kendra インデックスを作成し、 API を使用している場合はインデックス ID を記録しました。
-
データソースの IAM ロールを作成し、 API を使用している場合は、 IAM ロールの ARN を記録しました。
注記
認証タイプと認証情報を変更する場合は、 IAM ロールを更新して正しい AWS Secrets Manager シークレット ID にアクセスする必要があります。
-
Google Drive の認証情報を AWS Secrets Manager シークレットに保存し、API を使用している場合は、シークレットの ARN を記録済み。
注記
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
既存の IAM ロールまたはシークレットがない場合は、Google Drive データソースを接続するときにコンソールを使用して新しい IAM ロールと Secrets Manager シークレットを作成できます Amazon Kendra。API を使用している場合は、既存の IAM ロールと Secrets Manager シークレットの ARN とインデックス ID を指定する必要があります。
接続手順
Google Drive データソース Amazon Kendra に接続するには、 がデータ Amazon Kendra にアクセスできるように、Google Drive データソースの必要な詳細を指定する必要があります。用に Google Drive をまだ設定していない場合は、 Amazon Kendra 「」を参照してください前提条件。
Google Drive Amazon Kendra に接続するには
-
AWS マネジメントコンソールにサインインし、Amazon Kendra コンソール
を開きます。 -
左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。
注記
[インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。
-
[使用開始] ページで、[データソースを追加] を選択します。
-
[データソースを追加する] ページで [Google Drive コネクタ V1.0] を選択し、[コネクタを追加] を選択します。
-
[データソースの詳細を指定] ページで、次の情報を入力します。
-
[名前と説明] の [データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。
-
(オプション) [説明] - オプションで、データソースの説明を入力します。
-
デフォルト言語 - インデックスのドキュメントをフィルタリングする言語を選択します。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。
-
タグで、新しいタグを追加する - リソースを検索およびフィルタリングしたり、 AWS コストを追跡したりするためのオプションのタグを含めます。
-
[Next (次へ)] を選択します。
-
-
[アクセスとセキュリティの定義] ページで、次の情報を入力します。
-
[認証のタイプ] の場合 - [既存] と [新規] を選択します。既存のシークレットを使用する場合は、[シークレットを選択] を使用してシークレットを選択してください。
-
新しいシークレットの作成を選択すると、 AWS Secrets Manager シークレットオプションが開きます。
-
[ AWS Secrets Manager シークレットウィンドウを作成] に次の情報を入力します。
-
[シークレット名] - シークレットの名前。シークレットネームには「AmazonKendra-Google Drive-」というプレフィックスが自動的に追加されます。
-
[管理者アカウントの E メール]、[クライアントの E メール]、[プライベートキー] の場合 - Google Drive アカウントから生成してダウンロードした認証情報の値を入力します。
-
[認証を保存] を選択します。
-
-
-
IAM role - 既存の IAM ロールを選択するか、リポジトリの認証情報とインデックスコンテンツにアクセスするための新しい IAM ロールを作成します。
注記
IAM インデックスに使用される ロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。
-
[Next (次へ)] を選択します。
-
-
[同期設定の構成] ページで、次の情報を入力します。
-
[ユーザーアカウントを除外する] - インデックスから除外する Google Drive ユーザー。最大 100 件のユーザーアカウントを追加できます。
-
[共有ドライブを除外する] - インデックスから除外する Google Drive の共有ドライブ。最大 100 件の共有ドライブを追加できます。
-
[ファイルタイプのドライブを除外する] - インデックスから除外する Google Drive のファイルタイプ。MIME タイプの選択を編集することもできます。
-
[追加設定] の場合: 特定のコンテンツを含めるか除外する正規表現パターンを指定します。最大 100 のパターンを追加できます。
-
[頻度] - Amazon Kendra がデータソースと同期する頻度。
-
[Next (次へ)] を選択します。
-
-
[フィールドマッピングを設定] ページで、次の情報を入力します。
-
GoogleDrive フィールド名とその他の推奨フィールドマッピングの場合 - インデックスにマッピングする Amazon Kendra 、生成されたデフォルトのデータソースフィールドから選択します。
-
[フィールドを追加] - カスタムデータソースフィールドを追加して、マッピング先のインデックスフィールド名とフィールドデータタイプを作成します。
-
[Next (次へ)] を選択します。
-
-
[確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。
詳細
Amazon Kendra と Google Drive データソースとの統合の詳細については、以下を参照してください。