耐障害性と処理能力のスループットを向上させる - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

耐障害性と処理能力のスループットを向上させる

スループットは、モデルが処理して返す入力と出力の数とレートによって定義されます。Amazon Bedrock でモデルを呼び出すか、モデルを呼び出す Amazon Bedrock のリソースを使用すると、モデルのスループットはクォータの対象となります。クォータはモデルとリージョンに依存し、次の値が含まれます。

Amazon Bedrock には、次のタイプのスループットがあります。

  • オンデマンドスループット – スループットの標準オプション。特定の でモデルを呼び出すことが含まれます AWS リージョン。クォータは、 の Amazon Bedrock エンドポイントとクォータで定義されます AWS 全般のリファレンス。

  • オンデマンドのクロスリージョン推論 – 設定された からリソースのオンデマンドプールを抽象化する推論プロファイルの呼び出しが含まれます AWS リージョン。推論プロファイルは、ソースリージョンから発信された推論リクエストを、プールで設定された別のリージョンにルーティングできます。クロスリージョン推論を使用すると、推論プロファイルで定義されたリージョン間でモデル呼び出しリクエストを動的にルーティングすることで、スループットが向上し、回復力が向上します。ユーザートラフィック、需要、リソースの使用率のルーティング要因。詳細については、「クロスリージョン推論によるレジリエンスの向上」を参照してください。

  • プロビジョンドスループット – 特定の のモデルの専用レベルのスループットの購入が含まれます AWS リージョン。プロビジョンドスループットクォータは、購入するモデルユニットの数によって異なります。詳細については、「Amazon Bedrock のプロビジョンドスループットでモデル呼び出し容量を増やす」を参照してください。

トピックを選択すると、スループットを向上させるためのオプションの詳細が表示されます。