翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
推論プロファイルは、Amazon Bedrock のリソースで、モデルと、推論プロファイルがモデル呼び出しリクエストをルーティングできる 1 つ以上のリージョンを定義します。推論プロファイルは、次のタスクに使用できます。
-
使用状況メトリクスの追跡 – CloudWatch ログを設定し、アプリケーション推論プロファイルを使用してモデル呼び出しリクエストを送信して、モデル呼び出しの使用状況メトリクスを収集します。これらのメトリクスは、推論プロファイルに関する情報を表示し、それを使用して決定を知らせるときに調べることができます。CloudWatch Logs の設定方法の詳細については、「」を参照してくださいCloudWatch Logs を使用してモデル呼び出しを監視する。
-
タグを使用してコストをモニタリングする – アプリケーション推論プロファイルにタグをアタッチして、オンデマンドモデル呼び出しリクエストを送信するときにコストを追跡します。コスト配分にタグを使用する方法の詳細については、「 AWS Billing ユーザーガイド」の「コスト配分タグを使用した AWS コストの整理と追跡」を参照してください。
-
クロスリージョン推論 – 複数の を含む推論プロファイルを使用してスループットを向上させます AWS リージョン。推論プロファイルは、これらのリージョンにモデル呼び出しリクエストを分散して、スループットとパフォーマンスを向上させます。クロスリージョン推論の詳細については、「」を参照してくださいクロスリージョン推論によるスループットの向上。
Amazon Bedrock には、次のタイプの推論プロファイルが用意されています。
-
クロスリージョン (システム定義) 推論プロファイル – Amazon Bedrock で事前定義され、モデルへのリクエストをルーティングできる複数のリージョンを含む推論プロファイル。
-
アプリケーション推論プロファイル – コストとモデルの使用を追跡するためにユーザーが作成する推論プロファイル。モデル呼び出しリクエストを 1 つのリージョンまたは複数のリージョンにルーティングする推論プロファイルを作成できます。
-
1 つのリージョンでモデルのコストと使用状況を追跡する推論プロファイルを作成するには、推論プロファイルがリクエストをルーティングするリージョンで基盤モデルを指定します。
-
複数のリージョンにわたるモデルのコストと使用状況を追跡する推論プロファイルを作成するには、推論プロファイルがリクエストをルーティングするモデルとリージョンを定義するクロスリージョン (システム定義) 推論プロファイルを指定します。
-
次の機能を備えた推論プロファイルを使用して、複数のリージョンにリクエストをルーティングし、これらの機能を使用して行われた呼び出しリクエストの使用状況とコストを追跡できます。
-
モデル推論 – Amazon Bedrock コンソールのプレイグラウンドで推論プロファイルを選択するか、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream オペレーションを呼び出すときに推論プロファイルの ARN を指定して、モデル呼び出しを実行するときに推論プロファイルを使用します。詳細については、「プロンプトを送信してモデル推論でレスポンスを生成する」を参照してください。
-
ナレッジベースのベクトルの埋め込みとレスポンスの生成 – ナレッジベースのクエリ後にレスポンスを生成するとき、またはデータソース内のテキスト以外の情報を解析するときに、推論プロファイルを使用します。詳細については、クエリとレスポンスを使用してナレッジベースをテストするおよびデータソースの解析オプションを参照してください。
-
モデル評価 – モデル評価ジョブを送信する際、評価するモデルとして推論プロファイルを送信できます。詳細については、「Amazon Bedrock リソースのパフォーマンスを評価する」を参照してください。
-
プロンプト管理 – プロンプト管理で作成したプロンプトのレスポンスを生成するときに、推論プロファイルを使用できます。詳細については、「Amazon Bedrock でプロンプト管理を使用して再利用可能なプロンプトを構築して保存する」を参照してください
-
フロー – フローのプロンプトノードでインラインで定義したプロンプトのレスポンスを生成するときに、推論プロファイルを使用できます。詳細については、「Amazon Bedrock Flows end-to-endの生成 AI ワークフローを構築する」を参照してください。
推論プロファイルを使用する料金は、推論プロファイルを呼び出すリージョンのモデルの料金に基づいて計算されます。料金に関する詳細については、「Amazon Bedrock の料金
クロスリージョン推論プロファイルで提供できるスループットの詳細については、「」を参照してくださいクロスリージョン推論によるスループットの向上。