翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Bedrock ナレッジベースでナレッジベースを作成する
Amazon Bedrock ナレッジベースを使用すると、独自の情報を生成 AI アプリケーションに統合して、検索拡張生成 (RAG) ソリューションを作成できます。ナレッジベースは、データを検索して最も有用な情報を検索し、それを使用して自然言語の質問に答えることができます。
注記
ルートユーザーを使用してナレッジベースを作成することはできません。これらのステップを開始する前に、 IAM ユーザーでログインします。
ナレッジベースを作成するときは、ナレッジベースの設定とアクセス許可を設定し、接続するデータソース、データを埋め込みに変換する埋め込みモデル、ベクトル埋め込みを保持するベクトルストアを選択します。任意の方法のタブを選択し、ステップに従います。
- Console
-
ナレッジベースの設定とアクセス許可を設定するには
-
IAM Amazon Bedrock のアクセス許可を持つ ロール AWS Management Console を使用して にサインインし、 で Amazon Bedrock コンソールを開きますhttps://console.aws.amazon.com/bedrock/
。 -
左側のナビゲーションペインで、ナレッジベースを選択します。
-
ナレッジベースセクションで、作成ボタンを選択します。
-
(オプション) デフォルトの名前を変更し、ナレッジベースの説明を入力します。
-
Amazon Bedrock に必要な他の AWS サービスにアクセスするためのアクセス許可を付与する AWS Identity and Access Management (IAM) ロールを選択します。Amazon Bedrock にサービスロールを作成させることも、作成したカスタムロールを選択することもできます。
-
ナレッジベースを接続するデータソースを選択します。
-
(オプション) ナレッジベースにタグを追加します。詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。
-
(オプション) ナレッジベースのアクティビティログを配信するサービスを設定します。
-
次のセクションに進み、データソースをナレッジベースに接続する「」の手順に従ってデータソースを設定します。
-
埋め込みモデルを選択して、データをベクトル埋め込みに変換します。
-
(オプション) 追加設定セクションを展開すると、次の設定オプションが表示されます (すべてのモデルがすべての設定をサポートしているわけではありません)。
-
埋め込みタイプ – データを浮動小数点 (float32) ベクトル埋め込み (より正確、ただしコストがかかります) またはバイナリベクトル埋め込み (より正確、かつ低コスト) に変換するかどうか。バイナリベクトルをサポートする埋め込みモデルについては、サポートされている埋め込みモデルを参照してください。
-
ベクトルディメンション – 値を大きくすると精度は向上しますが、コストとレイテンシーは増加します。
-
-
ベクトルストアを選択して、クエリに使用されるベクトル埋め込みを保存します。次のオプションがあります。
-
新しいベクトルストアのクイック作成 – Amazon Bedrock が作成できるベクトルストアの 1 つを選択します。
-
Amazon OpenSearch Serverless – Amazon Bedrock ナレッジベースは、Amazon OpenSearch Serverless ベクトル検索コレクションとインデックスを作成し、必須フィールドを使用して設定します。
-
Amazon Aurora PostgreSQL Serverless – Amazon Bedrock は Amazon Aurora PostgreSQL Serverless ベクトルストアを設定します。このプロセスでは、Amazon S3 バケットから非構造化テキストデータを取得し、テキストチャンクとベクトルに変換して、PostgreSQL データベースに保存します。詳細については、「Amazon Bedrock の Aurora PostgreSQL ナレッジベースをクイック作成」を参照してください。
-
Amazon Neptune 分析 – Amazon Bedrock は、検索拡張生成 (RAG) 手法をグラフと組み合わせて使用して生成 AI アプリケーションを強化し、エンドユーザーがより正確で包括的なレスポンスを得ることができます。
-
-
作成したベクトルストアを選択する – サポートされているベクトルストアを選択し、ベクトルインデックス内のベクトルフィールド名とメタデータフィールド名を識別します。詳細については、「ナレッジベースの独自のベクトルストアの前提条件」を参照してください。
注記
データソースが Confluence、Microsoft SharePoint、または Salesforce インスタンスの場合、サポートされているベクトルストアサービスは Amazon OpenSearch Serverless のみです。
-
-
データソースにイメージが含まれている場合は、パーサーURIがデータから抽出するイメージを保存する Amazon S3 を指定します。イメージはクエリ中に返すことができます。
注記
マルチモーダルデータは、Amazon S3 およびカスタムデータソースでのみサポートされています。
-
ナレッジベースの詳細を確認します。次に進みナレッジベースを作成する前に、任意のセクションを編集できます。
注記
ナレッジベースの作成にかかる時間は、特定の設定によって異なります。ナレッジベースの作成が完了すると、ナレッジベースのステータスは準備中または利用可能な状態に変更されます。
ナレッジベースの準備ができて使用可能になったら、最初にデータソースの同期を行い、その後も必要に応じて同期を行いコンテンツを最新の状態に保ちます。コンソールでナレッジベースを選択し、データソースの概要セクションで [同期] を選択します。
-
- API
-
ナレッジベースを作成するには、Agents for Amazon Bedrock ビルドタイムエンドポイントを使用してCreateKnowledgeBaseリクエストを送信します。
注記
非構造化データソースに接続していて、Amazon Bedrock が Amazon OpenSearch Service でベクトルストアを作成および管理できるようにする場合は、 コンソールを使用します。詳細については、「Amazon Bedrock ナレッジベースでナレッジベースを作成する」を参照してください。
以下のフィールドが必要です。
フィールド 基本的な説明 名前 ナレッジベースの名前 roleArn ナレッジベースサービスロールARNの 。 knowledgeBaseConfiguration ナレッジベースの設定が含まれます。詳細については、以下を参照してください。 storageConfiguration (非構造化データソースに接続している場合にのみ必要です)。 選択したデータソースサービスの設定が含まれます。 で
knowledgeBaseConfiguration
、ナレッジベースを接続する予定のデータソースtype
の を指定し、使用する埋め込みモデルの ARN と設定を指定します。詳細については、「VectorKnowledgeBaseConfiguration」を参照してください。次のタイプを指定できます。-
VECTOR
– 非構造化データソースの場合。使用する埋め込みモデルの ARN と設定を指定します。詳細については、「VectorKnowledgeBaseConfiguration」を参照してください。 -
STRUCTURED
– 構造化データストア用。使用する構造化データストアのタイプとそのデータストアの設定を指定します。
次のフィールドはオプションです。
フィールド ユースケース description ナレッジベースの説明。 clientToken API リクエストが 1 回だけ完了するようにするため。詳細については、「べき等性の確保」を参照してください。 tags タグをエイリアスに関連付ける場合に指定します。詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。 knowledgeBaseConfiguration
フィールドは KnowledgeBaseConfiguration オブジェクトにマッピングされます。そのVECTOR
中で、type
フィールドに を指定します。でVectorKnowledgeBaseConfiguration、使用するARN埋め込みモデルの とその設定を指定します。storageConfiguration
フィールドは StorageConfiguration オブジェクトにマッピングされます。接続する予定のベクトルストアをtype
フィールドに指定し、そのベクトルストアに対応する フィールドを含めます。提供する必要がある情報の詳細については、 で各ベクトルストアの設定タイプStorageConfigurationを参照してください。 -