耐障害性と処理能力のスループットを向上させる - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

耐障害性と処理能力のスループットを向上させる

スループットは、モデルが処理して返す入力と出力の数とレートによって定義されます。Amazon Bedrock でモデルを呼び出すか、Amazon Bedrock でモデルを呼び出すリソースを使用すると、モデルのスループットはクォータの対象となります。クォータはモデルとリージョンによって異なり、次の値が含まれます。

Amazon Bedrock には、次のタイプのスループットがあります。

  • オンデマンドスループット — スループットの標準オプション。特定の でモデルを呼び出す AWS リージョン。 クォータは で定義されていますランタイムクォータ

  • オンデマンドのクロスリージョン推論 — 設定されているリソースのオンデマンドプールを抽象化する推論プロファイルの呼び出しが含まれます。 AWS リージョン。 推論プロファイルは、ソースリージョンから発信された推論リクエストを、プールで設定された別のリージョンにルーティングできます。クロスリージョン推論を使用すると、推論プロファイルで定義されたリージョン間でモデル呼び出しリクエストを動的にルーティングすることで、スループットが向上し、回復性が向上します。リソースのユーザートラフィック、需要、使用率のルーティング要因。詳細については、「クロスリージョン推論による耐障害性の向上」を参照してください。

  • プロビジョンドスループット — 特定の のモデル専用のスループットレベルを購入する AWS リージョン。 プロビジョンドスループットクォータは、購入するモデルユニットの数によって異なります。詳細については、「Amazon Bedrock のプロビジョンドスループットでモデル呼び出し容量を増やす」を参照してください。

トピックを選択すると、スループットを向上させるためのオプションの詳細が表示されます。