Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

ナレッジベース用に作成したベクトルストアを使用するための前提条件

フォーカスモード
ナレッジベース用に作成したベクトルストアを使用するための前提条件 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ドキュメントが変換されるベクトル埋め込みを保存するには、ベクトルストアを使用します。Amazon Bedrock で Amazon OpenSearch Serverless にベクトルインデックスを自動的に作成する場合は、この前提条件をスキップして Amazon Bedrock ナレッジベースでデータソースに接続してナレッジベースを作成する に進みます。

標準の浮動小数点 (float32) ベクトル埋め込みの代わりにバイナリベクトル埋め込みを保存する場合は、バイナリベクトルをサポートするベクトルストアを使用する必要があります。

注記

Amazon OpenSearch Serverless クラスターと Amazon OpenSearch Managed クラスターは、バイナリベクトルの保存をサポートする唯一のベクトルストアです。

独自のサポートされているベクトルストアを設定して、データのベクトル埋め込み表現をインデックス化できます。次のデータ用にフィールドを作成できます。

  • 選択した埋め込みモデルによってデータソースのテキストから生成されたベクトル用のフィールド。

  • データソース内のファイルから抽出されたテキストチャンク用フィールド。

  • Amazon Bedrock が管理するソースファイルのメタデータのフィールド。

  • (Amazon Aurora データベースを使用してメタデータのフィルタリングを設定する場合) ソースファイルに関連付けるメタデータのフィールド。他のベクトルストアでフィルタリングを設定する場合は、フィルタリングのためにこれらのフィールドを設定する必要はありません。

KMS キーを使用して、サードパーティーのベクトルストアを暗号化できます。詳細については、「Encryption of knowledge base resources」を参照してください。

ベクトルインデックスの作成に使用するベクトルストアサービスに対応するタブを選択します。

Amazon OpenSearch Serverless
  1. でアクセス許可を設定し、Amazon OpenSearch Serverless でベクトル検索コレクションを作成するには AWS Management Console、「Amazon OpenSearch Service デベロッパーガイド」の「ベクトル検索コレクションの使用」のステップ 1 と 2 に従います。コレクションを設定するときは、以下の考慮事項に注意してください。

    1. コレクションに任意の名前と説明を付けます。

    2. コレクションをプライベートにするには、[セキュリティ] セクションの [標準作成] を選択します。次に、[ネットワークアクセス設定] セクションで、[アクセスタイプ] として [VPC] を選択し、VPC エンドポイントを選択します。Amazon OpenSearch Serverless コレクションの VPC エンドポイントの設定の詳細については、「Amazon OpenSearch Service デベロッパーガイド」の「Access Amazon OpenSearch Serverless using an interface endpoint (AWS PrivateLink)」を参照してください。

  2. コレクションを作成したら、ナレッジベースを作成するときに備えて [コレクション ARN] を書き留めます。

  3. 左側のナビゲーションペインの [サーバーレス][コレクション] を選択します。次に、ベクトル検索コレクションを選択します。

  4. [インデックス] タブを選択します。次に、[ベクトルインデックスを作成] を選択します。

  5. [ベクトルインデックスの詳細] セクションで、ベクトルインデックス名フィールドに [ベクトルインデックスの名前] を入力します。

  6. [ベクトルフィールド] セクションで[ベクトルフィールドの追加] を選択します。Amazon Bedrock は、データソースのベクトル埋め込みをこのフィールドに保存します。次の設定の詳細を入力します。

    • ベクトルフィールド名 – フィールドの名前を指定します (例: embeddings)。

    • エンジン – 検索に使用するベクトルエンジン。[faiss] を選択します。

    • ディメンション - ベクトルのディメンション (次元) の数。ベクトルに含めるディメンションの数を決定するには、次の表を参照してください。

      モデル ディメンション
      Titan G1 埋め込み - テキスト 1,536
      Titan V2 埋め込み - テキスト 1,024、512、256
      Cohere Embed 英語 1,024
      Cohere Embed 多言語 1,024
    • 距離メトリクス - ベクトル間の類似性を測定するために使用されるメトリクス。浮動小数点ベクトル埋め込みにはユークリッドを使用することをお勧めします。

  7. [メタデータの管理] セクションを展開し、ナレッジベースがベクトルを使用して取得できる追加のメタデータを保存するよう、ベクトルインデックスを設定します。次の表は、各フィールドに対して指定するフィールドと値を示しています。

    フィールドの説明 フィールドのマッピング データ型 フィルタリング可能
    Amazon Bedrock はデータから未加工テキストをチャンク化し、チャンクをこのフィールドに保存します。 選択した名前 (例: text) String
    Amazon Bedrock は、ナレッジベースに関連するメタデータをこのフィールドに保存します。 選択した名前 (例: bedrock-metadata) String False
  8. ナレッジベースの作成時に、ベクトルインデックス名、ベクトルフィールド名、メタデータ管理マッピングフィールド名に選択した名前を書き留めます。次に [作成] を選択します。

ベクトルインデックスを作成したら、[ナレッジベースの作成] に進むことができます。次の表は、メモした各情報を入力する場所をまとめたものです。

フィールド ナレッジベース設定 (コンソール) の対応するフィールド ナレッジベース設定 (API) の対応するフィールド 説明
コレクション ARN コレクション ARN collectionARN ベクトル検索コレクションの Amazon リソースネーム (ARN)。
ベクトルインデックス名 ベクトルインデックス名 vectorIndexName ベクトルインデックスの名前。
ベクトルフィールド名 ベクトルフィールド vectorField データソースのベクトル埋め込みを保存するフィールドの名前。
メタデータ管理 (最初のマッピングフィールド) テキストフィールド textField データソースから未加工のテキストを保存するフィールドの名前。
メタデータ管理 (2 番目のマッピングフィールド) Bedrock が管理するメタデータフィールド metadataField Amazon Bedrock が管理するメタデータを保存するフィールドの名前。

Amazon OpenSearch Serverless でのベクトルストアの設定に関する詳細なドキュメントについては、「Amazon OpenSearch Service デベロッパーガイド」の「Working with vector search collections」を参照してください。

Amazon OpenSearch Service Managed Clusters
重要
  1. の OpenSearch クラスターでドメインとベクトルインデックスを作成するには AWS Management Console、「Amazon OpenSearch Service デベロッパーガイド」のOpenSearch Service ドメインの作成と管理」で説明されているステップに従います。 OpenSearch

    ドメインを設定するときは、次の考慮事項に注意してください。

    1. ドメインに任意の名前を付けます。

    2. Easy create オプションを使用して、ドメインの作成をすばやく開始することをお勧めします。

      注記

      このオプションは、スループットが低いドメインを提供します。より高いスループットを必要とするワークロードが大きい場合は、標準作成オプションを選択します。必要に応じて、後で容量を調整できます。このオプションを使用すると、最小容量から始めて、必要に応じて後で変更できます。

    3. Network では、パブリックアクセスを選択する必要があります。VPC の背後にある OpenSearch ドメインは、ナレッジベースではサポートされていません。

    4. バージョン では、バイナリベクトル埋め込みを使用している場合、Amazon Bedrock ナレッジベースには Engine バージョン 2.16 以降が必要です。さらに、k-nn インデックスを作成するには、バージョン 2.13 以降が必要です。詳細については、Amazon OpenSearch Service デベロッパーガイド「K-NN 検索」を参照してください。

    5. デュアルスタックモードを使用することをお勧めします。

    6. きめ細かなアクセスコントロールを有効にしてドメイン内のデータを保護し、ナレッジベースのサービスロールに OpenSearch ドメインへのアクセスを許可してリクエストを行うアクセス許可をさらに制御することをお勧めします。

    7. 他のすべての設定をデフォルト値のままにし、作成を選択してドメインを作成します。

  2. ドメインが作成されたら、それをクリックして、ナレッジベースの作成時の のドメイン ARNドメインエンドポイントを書き留めます。

  3. ドメインを作成したら、OpenSearch ダッシュボードで次のコマンドを実行するか、curl コマンドを使用してベクトルインデックスを作成できます。詳細については、「OpenSearch ドキュメント」を参照してください。

    コマンドを実行する場合:

    • ベクトルフィールドの名前を指定します (例: embeddings)。

    • 検索に使用されるベクトルが faiss であることを確認します。 nmslib はサポートされていません。

    • ベクトル内のディメンションの数については、次の表を参照して、ベクトルに含めるディメンションの数を決定します。

      注記

      Titan V2 埋め込み - テキストモデルは複数のディメンションをサポートしています。256 または 512 にすることもできます。

      モデル ディメンション
      Titan G1 埋め込み - テキスト 1,536
      Titan V2 埋め込み - テキスト 1,024、512、256
      Cohere Embed 英語 1,024
      Cohere Embed 多言語 1,024
    • 2 つのフィールドを追加して、ナレッジベースがベクトルで取得できる追加のメタデータを保存するようにベクトルインデックスを設定できます。次の表は、それぞれに指定するフィールドと値を示しています。

      フィールドの説明 フィールドのマッピング
      Amazon Bedrock はデータから未加工テキストをチャンク化し、チャンクをこのフィールドに保存します。 など、オブジェクトとして指定しますAMAZON_BEDROCK_TEXT_CHUNK
      Amazon Bedrock は、ナレッジベースに関連するメタデータをこのフィールドに保存します。 など、オブジェクトとして指定しますAMAZON_BEDROCK_METADATA
    PUT /<index-name> { "settings": { "index": { "knn": true } }, "mappings": { "properties": { "<vector-name>": { "type": "knn_vector", "dimension": <embedding-dimension>, "data_type": "binary", # Only needed for binary embeddings "space_type": "l2" | "hamming", # Use l2 for float embeddings and hamming for binary embeddings "method": { "name": "hnsw", "engine": "faiss", "parameters": { "ef_construction": 128, "m": 24 } } }, "AMAZON_BEDROCK_METADATA": { "type": "text", "index": "false" }, "AMAZON_BEDROCK_TEXT_CHUNK": { "type": "text", "index": "true" } } } }
  4. ドメイン ARN とエンドポイント、およびナレッジベースの作成時にベクトルインデックス名、ベクトルフィールド名、メタデータ管理マッピングフィールド名に選択した名前を書き留めます。

ベクトルインデックスを作成したら、[ナレッジベースの作成] に進むことができます。次の表は、メモした各情報を入力する場所をまとめたものです。

フィールド ナレッジベース設定 (コンソール) の対応するフィールド ナレッジベース設定 (API) の対応するフィールド 説明
ドメイン ARN ドメイン ARN domainARN OpenSearch ドメインの Amazon リソースネーム (ARN)。
ドメインエンドポイント ドメインエンドポイント domainEndpoint OpenSearch ドメインに接続するエンドポイント。
ベクトルインデックス名 ベクトルインデックス名 vectorIndexName ベクトルインデックスの名前。
ベクトルフィールド名 ベクトルフィールド vectorField データソースのベクトル埋め込みを保存するフィールドの名前。
メタデータ管理 (最初のマッピングフィールド) テキストフィールド textField データソースから未加工のテキストを保存するフィールドの名前。
メタデータ管理 (2 番目のマッピングフィールド) Bedrock が管理するメタデータフィールド metadataField Amazon Bedrock が管理するメタデータを保存するフィールドの名前。
Amazon Aurora (RDS)
  1. Using Aurora PostgreSQL as a knowledge base」の手順に従って、Amazon Aurora データベース (DB) クラスターを作成します。テーブルを作成するときは、次の列とデータ型で設定します。上の表に掲載されている名前の代わりに、希望する列名を使用できます。ナレッジベースの設定時に指定できるように、使用した列名をメモしておきます。

    ナレッジベースを作成する前に、これらのフィールドを指定する必要があります。ナレッジベースが作成されると、それらは更新されません。

    重要

    Aurora クラスターは、ナレッジベースが Amazon Bedrock 用に作成されるもの AWS アカウント と同じ に存在する必要があります。

    列名 データ型 ナレッジベース設定 (コンソール) の対応するフィールド ナレッジベース設定 (API) の対応するフィールド 説明
    id UUID プライマリキー プライマリキー primaryKeyField 各レコードに固有の識別子が含まれます。
    埋め込み ベクトル ベクトルフィールド vectorField データソースのベクトル埋め込みが含まれます。
    チャンク [テキスト] テキストフィールド textField データソースからの未加工テキストのチャンクが含まれます。
    metadata JSON Bedrock が管理するメタデータフィールド metadataField ソース属性を実行し、データインジェストとクエリを有効にするために必要なメタデータが含まれています
    custom_metadata JSONB カスタムメタデータフィールド customMetadataField Amazon Bedrock がデータソースからメタデータファイルのすべての情報を書き込む列を示すオプションフィールド。
  2. テキストフィールドと埋め込みフィールドの列ベクトルとテキストにインデックスを作成する必要があります。カスタムメタデータフィールドを使用している場合は、この列に GIN インデックスも作成する必要があります。GIN インデックスを使用すると、メタデータフィルタリングのために jsonb ドキュメント内のキーと値のペアを効率的に検索できます。詳細については、PostgreSQL ドキュメント「jsonb indexing」を参照してください。

    列名 でインデックスを作成する 必須?
    ベクトル CREATE INDEX ON bedrock_integration.bedrock_kb USING hnsw (embedding vector_cosine_ops); はい
    text CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (to_tsvector('simple', chunks)); はい
    カスタムメタデータ CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (custom_metadata); カスタムメタデータ列を作成している場合にのみ。
  3. (オプション) フィルタリングのためにファイルにメタデータを追加した場合は、カスタムメタデータフィールドに列名を指定して、すべてのメタデータを 1 つの列に保存することをお勧めします。データ取り込み中、この列にはデータソースのメタデータファイル内のすべての情報が入力されます。このフィールドを指定する場合は、この列に GIN インデックスを作成する必要があります。

    注記

    数値メタデータに対して範囲フィルターを頻繁に使用する場合は、パフォーマンスを最適化するために、特定のキーのインデックスを作成します。たとえば、 などのフィルターを使用する場合は"lessThan": { "key": "year", "value": 1989 }yearキーに式インデックスを作成します。詳細については、PostgreSQL ドキュメントの「式のインデックス」を参照してください。

    CREATE INDEX ON your_table ((custom_metadata->>'year')::double precision

    または、このフィールド名を指定しない場合、ファイル内のメタデータ属性ごとに列を作成し、データ型 (テキスト、数値、またはブール値) を指定できます。たとえば、 属性がデータソースgenreに存在する場合は、 という名前の列を追加genreし、 をデータ型textとして指定します。データ取り込み中、これらの個別の列には対応する属性値が入力されます。

  4. Amazon Aurora と を使用したパスワード管理の手順に従って、Aurora DB AWS Secrets Managerクラスターの AWS Secrets Manager シークレットを設定します。

  5. DB クラスターを作成しシークレットを設定したら、次の情報をメモします。

    ナレッジベース設定 (コンソール) のフィールド ナレッジベース設定 (API) のフィールド 説明
    Amazon Aurora DB クラスターの ARN resourceArn DB クラスターの ARN。
    データベース名 databaseName データベースの名前
    テーブル名 tableName DB クラスター内のテーブル名
    シークレット ARN credentialsSecretArn DB クラスターの AWS Secrets Manager キーの ARN
Neptune Analytics graphs (GraphRAG)
  1. の Neptune Analytics でグラフとベクトルストアを作成するには AWS Management Console、「Neptune Analytics ユーザーガイド」の「Neptune Analytics のベクトルインデックス作成」で説明されているステップに従います。

    注記

    Neptune GraphRAG を使用するには、ベクトル検索インデックスを使用して空の Neptune Analytics グラフを作成します。ベクトル検索インデックスは、グラフの作成時にのみ作成できます。コンソールで Neptune Analytics グラフを作成するときは、プロセスの最後にあるベクトル検索設定でインデックスディメンションを指定します。

    グラフを作成するときは、次の考慮事項に注意してください。

    1. グラフに任意の名前を付けます。

    2. データソースで、空のグラフの作成を選択し、割り当てる m-NCUsの数を指定します。各 m-NCU には、約 1 GiB のメモリ容量と、対応するコンピューティングとネットワークがあります。

      注記

      グラフの容量は後で変更できます。最小のインスタンスから開始し、必要に応じて後で別のインスタンスを選択することをお勧めします。

    3. デフォルトのネットワーク接続設定はそのままにしておくことができます。Amazon Bedrock は、ナレッジベースを関連付ける Neptune Analytics グラフへのネットワーク接続を作成します。グラフにパブリック接続やプライベートエンドポイントを設定する必要はありません。

    4. 「ベクトル検索設定」で、「ベクトルディメンションを使用」を選択し、各ベクトルのディメンション数を指定します。

      注記

      各ベクトルのディメンションの数は、埋め込みモデルのベクトルディメンションと一致する必要があります。ベクトルに含めるディメンションの数を決定するには、次の表を参照してください。

      モデル ディメンション
      Titan G1 埋め込み - テキスト 1,536
      Titan V2 埋め込み - テキスト 1,024、512、256
      Cohere Embed 英語 1,024
      Cohere Embed 多言語 1,024
    5. 他のすべての設定をデフォルトのままにして、グラフを作成します。

  2. グラフを作成したら、それをクリックして、ナレッジベースの作成時の のリソース ARNベクトルのディメンションを書き留めます。Amazon Bedrock で埋め込みモデルを選択するときは、Neptune Analytics グラフで設定したベクトルディメンションと同じディメンションのモデルを選択してください。

ベクトルインデックスを作成したら、[ナレッジベースの作成] に進むことができます。次の表は、メモした各情報を入力する場所をまとめたものです。

フィールド ナレッジベース設定 (コンソール) の対応するフィールド ナレッジベース設定 (API) の対応するフィールド 説明
グラフ ARN Neptune 分析グラフ ARN graphARN Neptune Analytics グラフの Amazon リソースネーム (ARN)。
メタデータ管理 (最初のマッピングフィールド) テキストフィールド名 textField データソースから未加工のテキストを保存するフィールドの名前。このフィールドには、テキストなど任意の値を指定できます。
メタデータ管理 (2 番目のマッピングフィールド) Bedrock が管理するメタデータフィールド metadataField Amazon Bedrock が管理するメタデータを保存するフィールドの名前。メタデータなど、このフィールドには任意の値を指定できます。
Pinecone
注記

を使用する場合Pinecone、ベクトルストアサービスを提供するために、 AWS がお客様に代わって指定されたサードパーティーソースにアクセスすることを許可することに同意します。お客様は、サードパーティーサービスからのデータの使用および転送に適用されるいかなるサードパーティー規約をも遵守する必要があります。

Pinecone でベクトルストアを設定する方法の詳細については、「Pinecone as a knowledge base for Amazon Bedrock」を参照してください。

ベクトルストアを設定する際は、次の情報をメモしておきます。この情報は、ナレッジベースを作成するときに入力することになります。

  • エンドポイント URL – インデックス管理ページのエンドポイント URL。

  • 認証情報シークレット ARN – データベースユーザーのユーザー名とパスワード AWS Secrets Manager を含む、 で作成したシークレットの Amazon リソースネーム (ARN)。

  • (オプション) 認証情報シークレット ARN のカスタマーマネージド KMS キー – 認証情報シークレット ARN を暗号化した場合は、Amazon Bedrock が復号できるように KMS キーを指定します。

  • 名前空間 – (オプション) データベースに新しいデータを書き込むために使用される名前空間。詳細については、「Using namespaces」を参照してください。

Pinecone インデックスを作成するときに必要となる追加の設定は以下のとおりです。

  • テキストフィールド名 – Amazon Bedrock が未加工チャンクテキストを保存するフィールドの名前。

  • メタデータフィールド名 – Amazon Bedrock がソース属性メタデータを保存するフィールドの名前。

Pinecone インデックスにアクセスするには、 AWS Secrets Managerを使用して Amazon Bedrock に Pinecone API キーを提供する必要があります。

Pinecone 設定用のシークレットを設定するには
  1. AWS Secrets Manager シークレットの作成」の手順に従って、 キーを に設定apiKeyし、 値を API キーとして設定してPineconeインデックスにアクセスします。

  2. この API キーを見つけるには、Pinecone コンソールを開いて [API キー] を選択します。

  3. シークレットを作成したら、作成したシークレットの ARN をメモしておきます。

  4. ナレッジベースを含むベクトルストアの AWS Secrets Manager シークレットを復号するアクセス許可」の手順に従って、KMS キーの ARN を復号化する権限をサービスロールにアタッチします。

  5. この ARN は、後でナレッジベースを作成するときに、[認証情報シークレット ARN] フィールドに入力します。

Redis Enterprise Cloud
注記

を使用する場合はRedis Enterprise Cloud、ベクトルストアのサービスをお客様に提供するために、お客様に代わって指定されたサードパーティーソースへのアクセスを AWS に許可することに同意します。お客様は、サードパーティーサービスからのデータの使用および転送に適用されるいかなるサードパーティー規約をも遵守する必要があります。

Redis Enterprise Cloud でのベクトルストアの設定に関する詳細なドキュメントについては、「Integrating Redis Enterprise Cloud with Amazon Bedrock」を参照してください。

ベクトルストアを設定する際は、次の情報をメモしておきます。この情報は、ナレッジベースを作成するときに入力することになります。

  • エンドポイント URL – データベースのパブリックエンドポイント URL。

  • ベクトルインデックス名 - データベースのベクトルインデックスの名前。

  • ベクトルフィールド - ベクトル埋め込みが保存されるフィールドの名前。ベクトルに含めるディメンションの数を決定するには、次の表を参照してください。

    モデル ディメンション
    Titan G1 埋め込み - テキスト 1,536
    Titan V2 埋め込み - テキスト 1,024、512、256
    Cohere Embed 英語 1,024
    Cohere Embed 多言語 1,024
  • テキストフィールド – Amazon Bedrock が未加工テキストのチャンクを保存するフィールドの名前。

  • Bedrock マネージドメタデータフィールド – Amazon Bedrock がナレッジベースに関連するメタデータを保存するフィールドの名前。

Redis Enterprise Cloud クラスターにアクセスするには、 AWS Secrets Managerを使用して Redis Enterprise Cloud のセキュリティ設定を Amazon Bedrock に提供する必要があります。

Redis Enterprise Cloud 設定用のシークレットを設定するには
  1. Transport Layer Security (TLS)」の手順に従って、Amazon Bedrock でデータベースを使用するように TLS を有効にします。

  2. AWS Secrets Manager シークレットを作成する」の手順に従います。シークレット内の Redis Enterprise Cloud 設定の適切な値を使用して、以下のキーを設定します。

    • username – Redis Enterprise Cloud データベースにアクセスするためのユーザー名。自身のユーザー名を確認するには、Redis コンソール でデータベースの [セキュリティ] セクションを参照してください。

    • password – Redis Enterprise Cloud データベースにアクセスするためのパスワード。自身のパスワードを確認するには、Redis コンソール でデータベースの [セキュリティ] セクションを参照してください。

    • serverCertificate - Redis Cloud 認証機関からの証明書の内容。「Download CA certificates」の手順に従って、Redis 管理コンソールを使ってサーバー証明書をダウンロードします。

    • clientPrivateKey - Redis Cloud 認証機関からの証明書のプライベートキー。「Download CA certificates」の手順に従って、Redis 管理コンソールを使ってサーバー証明書をダウンロードします。

    • clientCertificate - Redis Cloud 認証機関からの証明書のパブリックキー。「Download CA certificates」の手順に従って、Redis 管理コンソールを使ってサーバー証明書をダウンロードします。

  3. シークレットを作成したら、そのシークレットの ARN を書き留めます。この ARN は、後でナレッジベースを作成するときに、[認証情報シークレット ARN] フィールドに入力します。

MongoDB Atlas
注記

MongoDB Atlas を使用する場合は、ベクトルストアサービスを提供するために、 AWS がユーザーに代わって指定されたサードパーティーソースにアクセスすることを許可することに同意します。お客様は、サードパーティーサービスからのデータの使用および転送に適用されるいかなるサードパーティー規約をも遵守する必要があります。

MongoDB Atlas でのベクトルストアの設定に関する詳細なドキュメントについては、「MongoDB Atlas as a knowledge base for Amazon Bedrock」を参照してください。

ベクトルストアを設定する際は、次の情報をメモしておきます。この情報は、ナレッジベースを作成するときに入力することになります。

  • エンドポイント URL – MongoDB Atlas クラスターのエンドポイント URL。

  • データベース名 – MongoDB Atlas クラスター内のデータベースの名前。

  • コレクション名 – データベース内のコレクションの名前。

  • 認証情報シークレット ARN – MongoDB Atlas クラスター内のデータベースユーザーのユーザー名とパスワード AWS Secrets Manager を含む、 で作成したシークレットの Amazon リソースネーム (ARN)。

  • (オプション) 認証情報シークレット ARN のカスタマーマネージド KMS キー – 認証情報シークレット ARN を暗号化した場合は、Amazon Bedrock が復号できるように KMS キーを指定します。

MongoDB Atlas インデックスを作成するときに提供する必要があるフィールドマッピングの追加の設定は以下のとおりです。

  • ベクトルインデックス名 – コレクション上の MongoDB Atlas ベクトル検索インデックスの名前。

  • ベクトルフィールド名 – Amazon Bedrock がベクトル埋め込みを保存するフィールドの名前。

  • テキストフィールド名 – Amazon Bedrock が未加工チャンクテキストを保存するフィールドの名前。

  • メタデータフィールド名 – Amazon Bedrock がソース属性メタデータを保存するフィールドの名前。

  • (オプション) テキスト検索インデックス名 – コレクション上の MongoDB Atlas Search インデックスの名前。

(オプション) Amazon Bedrock を MongoDB Atlas クラスターに接続するには AWS PrivateLink、「Amazon Bedrock を使用した MongoDB Atlas での RAG ワークフロー」を参照してください。

  1. でアクセス許可を設定し、Amazon OpenSearch Serverless でベクトル検索コレクションを作成するには AWS Management Console、「Amazon OpenSearch Service デベロッパーガイド」の「ベクトル検索コレクションの使用」のステップ 1 と 2 に従います。コレクションを設定するときは、以下の考慮事項に注意してください。

    1. コレクションに任意の名前と説明を付けます。

    2. コレクションをプライベートにするには、[セキュリティ] セクションの [標準作成] を選択します。次に、[ネットワークアクセス設定] セクションで、[アクセスタイプ] として [VPC] を選択し、VPC エンドポイントを選択します。Amazon OpenSearch Serverless コレクションの VPC エンドポイントの設定の詳細については、「Amazon OpenSearch Service デベロッパーガイド」の「Access Amazon OpenSearch Serverless using an interface endpoint (AWS PrivateLink)」を参照してください。

  2. コレクションを作成したら、ナレッジベースを作成するときに備えて [コレクション ARN] を書き留めます。

  3. 左側のナビゲーションペインの [サーバーレス][コレクション] を選択します。次に、ベクトル検索コレクションを選択します。

  4. [インデックス] タブを選択します。次に、[ベクトルインデックスを作成] を選択します。

  5. [ベクトルインデックスの詳細] セクションで、ベクトルインデックス名フィールドに [ベクトルインデックスの名前] を入力します。

  6. [ベクトルフィールド] セクションで[ベクトルフィールドの追加] を選択します。Amazon Bedrock は、データソースのベクトル埋め込みをこのフィールドに保存します。次の設定の詳細を入力します。

    • ベクトルフィールド名 – フィールドの名前を指定します (例: embeddings)。

    • エンジン – 検索に使用するベクトルエンジン。[faiss] を選択します。

    • ディメンション - ベクトルのディメンション (次元) の数。ベクトルに含めるディメンションの数を決定するには、次の表を参照してください。

      モデル ディメンション
      Titan G1 埋め込み - テキスト 1,536
      Titan V2 埋め込み - テキスト 1,024、512、256
      Cohere Embed 英語 1,024
      Cohere Embed 多言語 1,024
    • 距離メトリクス - ベクトル間の類似性を測定するために使用されるメトリクス。浮動小数点ベクトル埋め込みにはユークリッドを使用することをお勧めします。

  7. [メタデータの管理] セクションを展開し、ナレッジベースがベクトルを使用して取得できる追加のメタデータを保存するよう、ベクトルインデックスを設定します。次の表は、各フィールドに対して指定するフィールドと値を示しています。

    フィールドの説明 フィールドのマッピング データ型 フィルタリング可能
    Amazon Bedrock はデータから未加工テキストをチャンク化し、チャンクをこのフィールドに保存します。 選択した名前 (例: text) String
    Amazon Bedrock は、ナレッジベースに関連するメタデータをこのフィールドに保存します。 選択した名前 (例: bedrock-metadata) String False
  8. ナレッジベースの作成時に、ベクトルインデックス名、ベクトルフィールド名、メタデータ管理マッピングフィールド名に選択した名前を書き留めます。次に [作成] を選択します。

ベクトルインデックスを作成したら、[ナレッジベースの作成] に進むことができます。次の表は、メモした各情報を入力する場所をまとめたものです。

フィールド ナレッジベース設定 (コンソール) の対応するフィールド ナレッジベース設定 (API) の対応するフィールド 説明
コレクション ARN コレクション ARN collectionARN ベクトル検索コレクションの Amazon リソースネーム (ARN)。
ベクトルインデックス名 ベクトルインデックス名 vectorIndexName ベクトルインデックスの名前。
ベクトルフィールド名 ベクトルフィールド vectorField データソースのベクトル埋め込みを保存するフィールドの名前。
メタデータ管理 (最初のマッピングフィールド) テキストフィールド textField データソースから未加工のテキストを保存するフィールドの名前。
メタデータ管理 (2 番目のマッピングフィールド) Bedrock が管理するメタデータフィールド metadataField Amazon Bedrock が管理するメタデータを保存するフィールドの名前。

Amazon OpenSearch Serverless でのベクトルストアの設定に関する詳細なドキュメントについては、「Amazon OpenSearch Service デベロッパーガイド」の「Working with vector search collections」を参照してください。

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.