翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
アプリケーション推論プロファイルを作成する
1 つ以上のリージョンでアプリケーション推論プロファイルを作成して、モデルを呼び出すときに使用量とコストを追跡できます。
-
1 つのリージョンのアプリケーション推論プロファイルを作成するには、基盤モデルを指定します。そのモデルでそのリージョンに対して行われたリクエストの使用状況とコストが追跡されます。
-
複数のリージョンのアプリケーション推論プロファイルを作成するには、クロスリージョン (システム定義) 推論プロファイルを指定します。推論プロファイルは、選択したクロスリージョン (システム定義) 推論プロファイルで定義されたリージョンにリクエストをルーティングします。推論プロファイルでリージョンに対して行われたリクエストの使用状況とコストが追跡されます。
現在、推論プロファイルは Amazon Bedrock API を使用してのみ作成できます。
推論プロファイルを作成するには、Amazon Bedrock コントロールプレーンエンドポイントを使用して CreateInferenceProfile リクエストを送信します。
以下のフィールドが必要です。
フィールド | ユースケース |
---|---|
inferenceProfileName | 推論プロファイルの名前を指定します。 |
modelSource | コストと使用状況を追跡するモデルとリージョンを定義する基盤モデルまたはクロスリージョン (システム定義) 推論プロファイルを指定します。 |
次のフィールドはオプションです。
フィールド | ユースケース |
---|---|
description | 推論プロファイルの説明を入力します。 |
tags | 推論プロファイルにタグをアタッチするには。詳細については、Amazon Bedrock リソースにタグ付け「」および「コスト配分タグを使用した AWS コストの整理と追跡」を参照してください。 |
clientRequestToken | API リクエストが 1 回だけ完了するようにします。詳細については、「べき等性の確保」を参照してください。 |
レスポンスはinferenceProfileArn
、他の推論プロファイル関連のアクションで使用できる と、モデル呼び出しおよび Amazon Bedrock リソースで使用できる を返します。