翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Inference Recommender を使用したレコメンデーションジョブ
Amazon SageMaker Inference Recommender は、次の 2 種類のレコメンデーションを行うことができます。
-
推論レコメンデーション (
Default
ジョブタイプ) は、レコメンデーションインスタンスタイプに対して一連のロードテストを実行します。サーバーレスエンドポイントのロードテストを行うこともできます。このタイプのレコメンデーションジョブを起動するには、モデルパッケージ Amazon リソースネーム (ARN) のみを指定する必要があります。推論レコメンデーションジョブは 45 分以内に完了します。 -
エンドポイントのレコメンデーション (
Advanced
ジョブタイプ) は、目的の機械学習インスタンスまたはサーバーレスエンドポイントを選択し、カスタムトラフィックパターンを指定して、本番環境要件に基づいてレイテンシーとスループットの要件を指定するカスタムロードテストに基づいています。このジョブの完了には、設定されたジョブ期間とテストされた推論設定の合計数に応じて、平均 2 時間かかります。
どちらのタイプのレコメンデーションも、同じ APIs を使用してジョブを作成、記述、停止します。出力は、関連する環境変数、コスト、スループット、レイテンシーメトリクスに関連するインスタンス設定のレコメンデーションのリストです。レコメンデーションジョブには初期インスタンス数も用意されており、これを使用して自動スケーリングポリシーを設定できます。2 種類のジョブを区別するには、 SageMaker コンソールまたは を使用してジョブを作成するときに、 を指定Default
して予備エンドポイントレコメンデーションを作成しAPIs、カスタムロードテストとエンドポイントレコメンデーションAdvanced
を作成します。
注記
両方のタイプのレコメンデーションジョブを独自のワークフローで実行する必要はありません。どちらか一方は、他方とは独立して実行できます。
Inference Recommender では、想定インスタンスのリスト、またはモデルデプロイのコスト、スループット、レイテンシーが最適化された上位 5 つのインスタンスタイプを、信頼度スコアとともに提供することもできます。これらのインスタンスは、モデルをデプロイする際に選択できます。Inference Recommender はモデルに対して自動的にベンチマークを行い、想定インスタンスを提供します。これらは予備的なレコメンデーションであるため、より正確な結果を得るには、さらにインスタンスレコメンデーションジョブを実行することをお勧めします。プロスペクティブインスタンスを表示するには、 SageMaker モデルの詳細ページに移動します。詳細については、「想定インスタンスを即時に入手する」を参照してください。