アプリケーション推論プロファイルを作成する

1 つ以上のリージョンでアプリケーション推論プロファイルを作成して、モデルを呼び出すときに使用量とコストを追跡できます。

1 つのリージョンのアプリケーション推論プロファイルを作成するには、基盤モデルを指定します。そのモデルでそのリージョンに対して行われたリクエストの使用状況とコストが追跡されます。
複数のリージョンのアプリケーション推論プロファイルを作成するには、クロスリージョン (システム定義) 推論プロファイルを指定します。推論プロファイルは、選択したクロスリージョン (システム定義) 推論プロファイルで定義されたリージョンにリクエストをルーティングします。推論プロファイルでリージョンに対して行われたリクエストの使用状況とコストが追跡されます。

現在、推論プロファイルは Amazon Bedrock API を使用してのみ作成できます。

推論プロファイルを作成するには、Amazon Bedrock コントロールプレーンエンドポイントを使用して CreateInferenceProfile リクエストを送信します。

以下のフィールドが必要です。

フィールド	ユースケース
inferenceProfileName	推論プロファイルの名前を指定します。
modelSource	コストと使用状況を追跡するモデルとリージョンを定義する基盤モデルまたはクロスリージョン (システム定義) 推論プロファイルを指定します。

次のフィールドはオプションです。

フィールド	ユースケース
description	推論プロファイルの説明を入力します。
tags	推論プロファイルにタグをアタッチするには。詳細については、Amazon Bedrock リソースにタグ付け「」および「コスト配分タグを使用した AWS コストの整理と追跡」を参照してください。
clientRequestToken	API リクエストが 1 回だけ完了するようにします。詳細については、「べき等性の確保」を参照してください。

レスポンスはinferenceProfileArn、他の推論プロファイル関連のアクションで使用できると、モデル呼び出しおよび Amazon Bedrock リソースで使用できるを返します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

前提条件

アプリケーション推論プロファイルのタグを変更する