Amazon Bedrock ナレッジベースのデータソースを変更する - Amazon Bedrock

Amazon Bedrock ナレッジベースのデータソースを変更する

ナレッジベースのデータソースを更新できます (データソースの設定を変更するなど)。

データソースは、次の方法で更新できます。

  • データソースのファイルやコンテンツを追加、変更、または削除する。

  • データソースの設定や、データインジェスト中の一時的なデータの暗号化に使用する KMS キーを変更する。ソースやエンドポイントの設定の詳細を変更する場合は、必要なアクセス許可と Secrets Manager シークレット (該当する場合) を持つ IAM ロールを更新または新規作成する必要があります。

  • データソースの削除ポリシーを「Delete」または「Retain」に設定する。「Delete」の場合は、ナレッジベースまたはデータソースリソースの削除時に、データソースから取り込んでベクトル埋め込みに変換したデータをすべて削除できます。「Retain」の場合は、ナレッジベースまたはデータソースリソースの削除時に、データソースから取り込んでベクトル埋め込みに変換したデータをすべて残すことができます。ナレッジベースまたはデータソースリソースを削除しても、ベクトルストア自体は削除されません

データソースからファイルを追加、変更、または削除するたびに、ナレッジベースでファイルのインデックスが再作成されるように、データソースを同期する必要があります。同期は増分処理であるため、前回の同期以降に追加、変更、または削除されたドキュメントだけが処理されます。取り込みの開始前に、データソースが次の条件を満たしていることを確認してください。

  • ファイルがサポート対象の形式である。詳細については、「Support document formats」を参照してください。

  • ファイルのサイズが、「AWS 全般のリファレンス」の「Amazon Bedrock エンドポイントとクォータ」で指定されている取り込みジョブのファイルサイズを超えていない。

  • データソースにメタデータファイルが含まれている場合は、メタデータファイルが無視されないように、次の条件を確認してください。

    • .metadata.json ファイルが、関連付けられているソースファイルと同じファイル名と拡張子を共有している。

    • ナレッジベースのベクトルインデックスが Amazon OpenSearch Serverless ベクトルストア内にある場合は、ベクトルインデックスが faiss エンジンで設定されていることを確認してください。ベクトルインデックスが nmslib エンジンで設定されている場合は、次のいずれかを行う必要があります。

    • ナレッジベースのベクトルインデックスが Amazon Aurora データベースクラスターにある場合は、メタデータファイル内の各メタデータプロパティに対応する列がインデックス用のテーブルに含まれていることを、取り込みの開始前に確認してください。

データソースを更新する方法については、使用する手段に対応するタブを選択し、手順に従ってください。

Console
データソースを更新するには
  1. Amazon Bedrock のアクセス許可を持つ IAM ロールを使用して AWS Management Consoleにサインインし、Amazon Bedrock コンソール (https://console.aws.amazon.com/bedrock/) を開きます。

  2. 左側のナビゲーションペインで [ナレッジベース] を選択します。

  3. ナレッジベースの名前を選択します。

  4. [データソース] セクションで、編集および同期の対象データソースの横にあるラジオボタンを選択します。

  5. (オプション) [編集] を選択し、設定を変更して [送信] を選択します。ソースやエンドポイントの設定の詳細を変更する場合は、必要なアクセス許可と Secrets Manager シークレット (該当する場合) を持つ IAM ロールを更新または新規作成する必要があります。また、取り込んだ元データに基づくチャンキングの設定は変更できません。その場合は、データソースを再作成する必要があります。

    注記

    チャンキングの設定は変更できません。その場合は、データソースを再作成する必要があります。

  6. (オプション) 詳細設定の一部として、データソースのデータ削除ポリシーを編集することができます。

    データ削除ポリシーの設定では、次のいずれかを選択できます。

    • 削除: ナレッジベースまたはデータソースリソースの削除時に、ベクトル埋め込みに変換されたデータソースからすべてのデータを削除します。ベクトルストア自体は削除されず、データのみが削除されます。このフラグは、AWS アカウントが削除された場合は無視されます。

    • 保持: ナレッジベースまたはデータソースリソースの削除時に、ベクトル埋め込みに変換されたデータソースからすべてのデータを保持します。ナレッジベースまたはデータソースリソースを削除しても、ベクトルストア自体は削除されません

  7. [同期] を選択します。

  8. 同期が完了すると緑色のバナーが表示され、[ステータス][準備完了] になります。

API
データソースを更新するには
  1. (オプション) Amazon Bedrock エージェントのビルドタイムエンドポイントUpdateDataSource リクエストを送信し、設定を適宜変更します。変更しないものについては同じ設定を指定してください。ソースやエンドポイントの設定の詳細を変更する場合は、必要なアクセス許可と Secrets Manager シークレット (該当する場合) を持つ IAM ロールを更新または新規作成する必要があります。

    注記

    chunkingConfiguration を変更することはできません。既存の chunkingConfiguration を使用してリクエストを送信するか、データソースを再作成してください。

  2. (オプション) データソースの dataDeletionPolicy を変更します。DELETE の場合は、ナレッジベースまたはデータソースリソースの削除時に、データソースから取り込んでベクトル埋め込みに変換したデータをすべて削除できます。このフラグは、AWS アカウントが削除された場合は無視されます。RETAIN の場合は、ナレッジベースまたはデータソースリソースの削除時に、データソースから取り込んでベクトル埋め込みに変換したデータをすべて残すことができます。ナレッジベースまたはデータソースリソースを削除しても、ベクトルストア自体は削除されません

  3. Amazon Bedrock エージェントのビルドタイムエンドポイントStartIngestionJob リクエストを送信し、dataSourceIdknowledgeBaseId を指定します。