Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

クロスリージョン推論によるスループットの向上

フォーカスモード
クロスリージョン推論によるスループットの向上 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

クロスリージョン推論は、推論リクエストを処理するために、地理的な AWS リージョン 最適な を自動的に選択します。これにより、利用可能なリソースとモデルの可用性を最大化することで、カスタマーエクスペリエンスが向上します。

オンデマンドモードでモデル推論を実行する際、リクエストはサービスクォータまたはピーク使用時間によって制限される場合があります。クロスリージョン推論を使用すると、さまざまな でコンピューティングを利用することで、計画外のトラフィックバーストをシームレスに管理できます AWS リージョン。クロスリージョン推論を使用すると、複数の にトラフィックを分散できるため AWS リージョン、スループットが向上します。

プロビジョンドスループットを購入することで、モデルのスループットを向上させることもできます。推論プロファイルは現在、プロビジョンドスループットをサポートしていません。

推論プロファイルを使用してクロスリージョン推論を実行できるリージョンとモデルを確認するには、「」を参照してください推論プロファイルでサポートされているリージョンとモデル

クロスリージョン (システム定義) 推論プロファイルは、サポートするモデルにちなんで命名され、サポートするリージョンによって定義されます。クロスリージョン推論プロファイルがリクエストを処理する方法を理解するには、次の定義を確認してください。

  • ソースリージョン – 推論プロファイルを指定する API リクエストを行うリージョン。

  • 送信先リージョン – Amazon Bedrock サービスが送信元リージョンからリクエストをルーティングできるリージョン。

ソースリージョンからクロスリージョン推論プロファイルを呼び出すと、Amazon Bedrock サービスは推論プロファイルで定義された送信先リージョンのいずれかにリクエストをルーティングします。

注記

一部の推論プロファイルは、呼び出し元のソースリージョンに応じて異なる送信先リージョンにルーティングされます。たとえば、米国東部 (オハイオ) us.anthropic.claude-3-haiku-20240307-v1:0から を呼び出すと、リクエストを us-east-1us-east-2、または にルーティングできますがus-west-2、米国西部 (オレゴン) から呼び出すと、 us-east-1および にのみリクエストをルーティングできますus-west-2

推論プロファイルの送信元リージョンと送信先リージョンを確認するには、次のいずれかを実行します。

注記

推論プロファイルはイミュータブルです。つまり、既存の推論プロファイルに新しいリージョンを追加しません。ただし、新しいリージョンを組み込んだ新しい推論プロファイルを作成する場合があります。セットアップの IDs を新しい ID に変更することで、これらの推論プロファイルを使用するようにシステムを更新できます。

クロスリージョン推論に関する以下の情報に注意してください。

  • クロスリージョン推論を使用する場合、追加のルーティングコストはかかりません。料金は、推論プロファイルを呼び出すリージョンに基づいて計算されます。料金に関する詳細については、「Amazon Bedrock の料金」を参照してください。

  • クロスリージョン推論を使用する場合、スループットは単一のリージョンでモデルを呼び出すよりも高くなります。クロスリージョンスループットのデフォルトのクォータを確認するには、「」の「クロスリージョンモデル InvokeModel requests per minute」と「Cross-Region InvokeModel tokens per minute values」を参照してくださいhttps://docs.aws.amazon.com/https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock AWS 全般のリファレンス。

  • クロスリージョン推論リクエストは、データが最初に存在する地域の一部 AWS リージョンである 内に保持されます。たとえば、米国内で行われたリクエストは、米国の AWS リージョン内に保持されます。データはソースリージョンにのみ保存されますが、クロスリージョン推論中に入力プロンプトと出力結果がソースリージョン外に移動する場合があります。すべてのデータは Amazon の安全なネットワーク経由で暗号化されて送信されます。

クロスリージョン (システム定義) 推論プロファイルを使用する

クロスリージョン推論を使用するには、次の方法でモデル推論を実行するときに推論プロファイルを含めます。

推論プロファイルを使用してリージョン間でモデル呼び出しリクエストを送信する方法については、「」を参照してくださいモデル呼び出しで推論プロファイルを使用する

クロスリージョン推論の詳細については、「Amazon Bedrock でのクロスリージョン推論の開始方法」を参照してください。

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.