Amazon Bedrock でのインテリジェントなプロンプトルーティングについて

フォーカスモード

Amazon Bedrock でのインテリジェントなプロンプトルーティングについて - Amazon Bedrock

利点デフォルトおよび設定されたプロンプトルーター考慮事項と制限事項プロンプトルーター基準とフォールバックモデルインテリジェントなプロンプトルーティングの仕組みインテリジェントなプロンプトルーティングの使用方法

注記

Amazon Bedrock のインテリジェントプロンプトルーティングはプレビュー中であり、変更される可能性があります。

Amazon Bedrock インテリジェントプロンプトルーティングは、単一のサーバーレスエンドポイントを提供し、同じモデルファミリー内の異なる基盤モデル間でリクエストを効率的にルーティングします。リクエストごとに各モデルのレスポンス品質を動的に予測し、最適なレスポンス品質でモデルにリクエストをルーティングできます。これにより、レスポンスの品質とコストの両方を最適化できます。

利点

レスポンスの品質とコストの最適化： プロンプトをさまざまな基盤モデルにルーティングして、最も低いコストで最高のレスポンス品質を実現します。
管理の簡素化： 複雑なオーケストレーションロジックが不要になります。
Future-Proof: 利用可能になった新しいモデルを組み込みます。

デフォルトおよび設定されたプロンプトルーター

インテリジェントなプロンプトルーティングを使用する場合は、Amazon Bedrock が提供するデフォルトのプロンプトルーターを使用するか、独自のプロンプトルーターを設定できます。

デフォルトのプロンプトルーターは、Amazon Bedrock が提供する事前設定されたルーティングシステムです。これらのルーターには事前定義された設定があり、特定の基盤モデルでout-of-the-box機能するように設計されています。ルーティング設定を構成することなく、シンプルでready-to-useソリューションを提供します。IPR を開始するときは、Amazon Bedrock が提供するデフォルトのルーターを試すことをお勧めします。プレビュー中に、Anthropic および Meta ファミリーで一部のモデルを使用することを選択できます。

設定されたプロンプトルーターを使用すると、特定のニーズや好みに合わせた独自のルーティング設定を定義できます。リクエストのルーティング方法と使用するモデルをより細かく制御する必要がある場合に適しています。設定済みルーターは、レスポンス品質メトリクスとユースケースに基づいて最適化を可能にします。デフォルトルーターを試したら、アプリケーションに適した独自のルーターを設定し、プレイグラウンドのレスポンス品質を評価し、要件を満たしている場合は本番稼働用アプリケーションに使用できます。

考慮事項と制限事項

Amazon Bedrock でのインテリジェントなプロンプトルーティングに関する考慮事項と制限事項を次に示します。

インテリジェントプロンプトルーティングは、英語プロンプトにのみ最適化されています。
インテリジェントプロンプトルーティングでは、アプリケーション固有のパフォーマンスデータに基づいてルーティングの決定やレスポンスを調整できません。
インテリジェントプロンプトルーティングは、一意または特殊なユースケースに最適なルーティングを提供するとは限りません。ルーティングの有効性は、初期トレーニングデータによって異なります。

プロンプトルーター基準とフォールバックモデル

プロンプトルーターを設定するときは、ルーティング条件を指定できます。ルーティング条件は、レスポンス品質の差に基づいてリクエストを処理するために選択するモデルを決定するために使用されます。この基準を使用して、フォールバックモデルのレスポンスが他のモデルのレスポンスにどれだけ近いかを判断します。

フォールバックモデル

リクエストに適したフォールバックモデルを選択します。このモデルは、信頼性の高いベースラインとして機能します。その後、別のモデルを選択して、フォールバックモデルと比較して精度を向上させるか、コストを削減できます。フォールバックモデルはアンカーとして機能し、ルーティング基準はレスポンス品質の差に基づいて他のモデルに切り替えるタイミングを決定します。

レスポンス品質の差

レスポンス品質の差は、フォールバックモデルと他のモデルのレスポンスの格差を測定します。値が小さいほど、レスポンスが類似していることを示します。値が大きいほど、フォールバックモデルと他のモデル間のレスポンスに大きな違いがあることを示します。

例えば、応答品質の差が 10% の場合、フォールバックモデル Claude Haiku3 の応答品質が 10% の場合、応答が Claude Haiku3 の応答よりも 10% 優れている場合にのみ、ルーターは別のモデル Claude Sonnet3 に切り替えます。 Haiku3

インテリジェントなプロンプトルーティングの仕組み

モデルの選択とルーターの設定

アプリケーションに使用するモデルのファミリーを選択します。デフォルトのプロンプトルーターを使用している場合は、Anthropic または Meta ファミリーのモデルから選択できます。設定されたプロンプトルーターを使用している場合は、追加のモデルから選択し、ルーティング条件を設定できます。詳細については、「インテリジェントなプロンプトルーティングの使用方法」を参照してください。
受信リクエストの分析

受信リクエストごとに、システムはプロンプトを分析してその内容とコンテキストを理解します。
レスポンス品質予測

Amazon Bedrock は、プロンプトに基づいて、選択したファミリー内の指定された各モデルのレスポンス品質を予測します。プロンプトルーターを設定した場合、応答品質の違いであるルーティング条件が考慮され、条件が満たされない場合にリクエストが指定されたフォールバックモデルにルーティングされます。
モデルの選択とリクエストの転送

レスポンス品質の予測に基づいて、Amazon Bedrock は特定のリクエストのレスポンス品質とコストの最適な組み合わせを提供するモデルを動的に選択します。その後、リクエストは選択したモデルに転送され、処理されます。
レスポンス処理

選択したモデルからのレスポンスが取得され、ユーザーに返されます。レスポンスには、リクエストの処理に使用されたモデルに関する情報が含まれます。

インテリジェントなプロンプトルーティングの使用方法

インテリジェントなプロンプトルーティングを開始するには、Amazon Bedrock コンソール AWS CLI、または AWS SDK を使用します。

注記

インテリジェントなプロンプトルーティングを最大限に活用するには、定期的にパフォーマンスを確認して新しいモデルを活用する必要があります。使用量を最適化するには、使用可能なパフォーマンスとコストのメトリクスをモニタリングします。

以下のセクションでは、コンソールと CLI からこの機能を使用する方法を示します。プロンプトルーターを設定すると、Amazon Bedrock は「」で説明されているステップを実行して、選択したルーターのモデルのいずれかからレスポンスインテリジェントなプロンプトルーティングの仕組みを生成します。

console

からインテリジェントなプロンプトルーティングを使用するには AWS Management Console：

Amazon Bedrock コンソールのプロンプトルーターハブに移動します。認証情報 AWS を使用してコンソールにログインします。
使用するモデルファミリーを選択します。機能を初めて使用する場合は、デフォルトのプロンプトルーターを試すことができます。プレビュー中に、Anthropic または Meta ファミリーのモデルから選択できます。その後、プレイグラウンドを開き、プロンプトを試すことができます。

注記
同じファミリー内で 2 つのモデルのみを選択する必要があります。
デフォルトのルーターを試したら、ルーターを設定できます。ルーターの一意の名前とオプションの説明を指定する必要があります。
プロンプトを異なるモデルにルーティングするためのルーティングルールを定義します。ルーティングのモデル、ルーティング条件、およびルーティング条件が満たされない場合に使用するフォールバックモデルを指定します。
プレイグラウンドを開き、さまざまなプロンプトを試して、プロンプトルーターのパフォーマンスをモニタリングできるようになりました。プロンプトのルーティング方法と各モデルのパフォーマンスを分析することで、必要に応じてルーティング基準とモデルを調整し、パフォーマンスとコストを最適化できます。

API

を使用してインテリジェントなプロンプトルーティングを使用するには AWS CLI：

デフォルトのプロンプトルーターを試したら、 CreatePromptRouter API または create-prompt-router CLI コマンドを使用してインテリジェントなプロンプトルーティングを処理できるルーターを作成できます。

次のコマンドは、プロンプトルーターを作成する例を示しています。
- <router-name> はルーターの一意の名前です。
- <region> は、ルーターを作成する AWS リージョンです。
- <modelA> と <modelB> は、ルーティング用に選択するモデルです。例えば、anthropic.claude-3-5-sonnet-20240620-v1:0。
```
aws bedrock create-prompt-router \
    --prompt-router-name <router-name> \
    --models '[{"modelArn": "arn:aws:bedrock:<region>::foundation-model/<modelA>"}]' \ 
    --fallback-model '[{"modelArn": "arn:aws:bedrock:<region>::foundation-model/<modelB>"}]' \ 
    --routing-criteria '{"responseQualityDifference": 0.5}'
```
を使用して、インテリジェントプロンプトルーターにプロンプトを送信します AWS CLI。ルーターは各モデルの応答品質を予測し、最適な応答品質でモデルにリクエストをルーティングします。
リクエストに対するレスポンスを確認します。これには、使用されたモデルとルーティング条件に関する情報が含まれます。
プロンプトルーターを使用する場合は、次の追加の API オペレーションを使用することもできます。

anchor anchor

からインテリジェントなプロンプトルーティングを使用するには AWS Management Console：

Amazon Bedrock コンソールのプロンプトルーターハブに移動します。認証情報 AWS を使用してコンソールにログインします。
使用するモデルファミリーを選択します。機能を初めて使用する場合は、デフォルトのプロンプトルーターを試すことができます。プレビュー中に、Anthropic または Meta ファミリーのモデルから選択できます。その後、プレイグラウンドを開き、プロンプトを試すことができます。

注記
同じファミリー内で 2 つのモデルのみを選択する必要があります。
デフォルトのルーターを試したら、ルーターを設定できます。ルーターの一意の名前とオプションの説明を指定する必要があります。
プロンプトを異なるモデルにルーティングするためのルーティングルールを定義します。ルーティングのモデル、ルーティング条件、およびルーティング条件が満たされない場合に使用するフォールバックモデルを指定します。
プレイグラウンドを開き、さまざまなプロンプトを試して、プロンプトルーターのパフォーマンスをモニタリングできるようになりました。プロンプトのルーティング方法と各モデルのパフォーマンスを分析することで、必要に応じてルーティング基準とモデルを調整し、パフォーマンスとコストを最適化できます。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

プロンプトエンジニアリングとは

プロンプトを設計する

次のトピック

プロンプトを設計する

前のトピック:

プロンプトエンジニアリングとは

ヘルプが必要ですか?

このページの内容

Cookie の設定を選択する

Cookie の設定をカスタマイズする

Essential

Performance

Functional

Advertising

Cookie の設定を保存できません

Amazon Bedrock でのインテリジェントなプロンプトルーティングについて

注記

トピック

利点

デフォルトおよび設定されたプロンプトルーター

考慮事項と制限事項

プロンプトルーター基準とフォールバックモデル

フォールバックモデル

レスポンス品質の差

インテリジェントなプロンプトルーティングの仕組み

モデルの選択とルーターの設定

受信リクエストの分析

レスポンス品質予測

モデルの選択とリクエストの転送

レスポンス処理