想定インスタンスを即時に入手する

Inference Recommender は、SageMaker AI モデルの詳細ページで、モデルに適した可能性のあるインスタンスまたはインスタンスタイプのリストを提供することもできます。Inference Recommender はモデルに対して自動的に予備的なベンチマークを行い、上位 5 つの想定インスタンスを提供します。これらは予備的なレコメンデーションであるため、より正確な結果を得るには、さらにインスタンスレコメンデーションジョブを実行することをお勧めします。

DescribeModel API、SageMaker Python SDK、または SageMaker AI コンソールを使用して、モデルの候補インスタンスのリストをプログラムで表示できます。

注記

この機能が利用可能になる前に SageMaker AI で作成したモデルの潜在的なインスタンスは取得されません。

コンソールを使用してモデルの想定インスタンスを表示するには、以下の操作を行います。

https://console.aws.amazon.com/sagemaker/ で、SageMaker コンソールに移動します。
左側のナビゲーションペインで [推論] を選択し、次に [モデル] を選択します。
モデルのリストから、目的のモデルを選択します。

モデルの詳細ページで、[モデルをデプロイする想定インスタンス] セクションに移動します。次のスクリーンショットは、このセクションを示しています。

このセクションには、モデルデプロイのコスト、スループット、レイテンシーが最適化される想定インスタンスが、メモリサイズ、CPU と GPU の数、時間あたりのコストなどのインスタンスタイプごとの追加情報とともに表示されます。

サンプルペイロードをベンチマークしてモデルの推論の完全レコメンデーションジョブを実行する場合は、このページからデフォルトの推論レコメンデーションジョブを開始できます。コンソールからデフォルトジョブを開始するには、以下の操作を行います。

モデルの詳細ページの [モデルをデプロイする想定インスタンス] セクションで [推論レコメンダージョブを実行] を選択します。
表示されるダイアログボックスの [ペイロードのベンチマーク用 S3 バケット] に、モデルのサンプルペイロードを保存した Amazon S3 の場所を入力します。
[ペイロードコンテンツタイプ] には、ペイロードデータの MIME タイプを入力します。
(オプション) [SageMaker Neo を使用したモデルコンパイル] セクションの [データ入力設定] にデータ形状をディクショナリ形式で入力します。
[ジョブの実行] を選択します。

Inference Recommender がジョブを開始し、SageMaker AI コンソールの推論レコメンダーリストページからジョブとその結果を表示できます。

高度なジョブを実行してカスタムのロードテストを実行する場合や、ジョブに追加の設定とパラメータを設定する場合は、「カスタムロードテストを実行する」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

レコメンデーションジョブ

推論レコメンデーション