翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Inference Recommender
Amazon SageMaker Inference Recommender は Amazon SageMaker AI の一機能です。これにより、SageMaker AI ML インスタンス間で負荷テストとモデルチューニングを自動化することで、本番環境で機械学習 (ML) モデルを取得するために必要な時間を短縮できます。Inference Recommender を使用して、リアルタイムまたはサーバーレスの推論エンドポイントにモデルをデプロイすれば、最小のコストでベストパフォーマンスを実現できます。Inference Recommender は、機械学習モデルとワークロードに最適なインスタンスタイプと設定を選択するのに役立ちます。インスタンス数、コンテナパラメータ、モデル最適化、最大同時実行数、メモリサイズなどの要因を考慮します。
Amazon SageMaker Inference Recommender は、ジョブの実行中に使用されたインスタンスに対してのみ課金されます。
仕組み
Amazon SageMaker Inference Recommender を使用するには、SageMaker AI モデルを作成するか、モデルアーティファクトを使用して SageMaker Model Registry にモデルを登録します。 AWS SDK for Python (Boto3) または SageMaker AI コンソールを使用して、さまざまな SageMaker AI エンドポイント設定のベンチマークジョブを実行します。推論レコメンダージョブは、パフォーマンスとリソース使用率に関するメトリクスを収集して視覚化し、どのエンドポイントタイプと構成を選択するかを決定するのに役立ちます。
開始方法
Amazon SageMaker Inference Recommender を初めて使用する方には、次のことをお勧めします。
-
「Amazon SageMaker Inference Recommender を使用するための前提条件」セクションを参照し、Amazon SageMaker Inference Recommender を使用するための要件を満たしていることを確認します。
-
「Amazon SageMaker Inference Recommender を使用したレコメンデーションジョブ」セクションを参照し、最初の推論レコメンダーのレコメンデーションジョブを開始します。
-
入門者向けの Amazon SageMaker Inference Recommender Jupyter Notebook
の例を試すか、次のセクションでノートブックのサンプルを確認してください。
サンプルノートブックの例
以下の Jupyter Notebook の例は、Inference Recommender の複数のユースケースのワークフローに役立ちます。
-
TensorFlow モデルをベンチマークする入門用ノートブックが必要な場合は、SageMaker Inference Recommender TensorFlow
ノートブックを参照してください。 -
HuggingFace モデルをベンチマークする場合は、SageMaker Inference Recommender for HuggingFace
ノートブックを参照してください。 -
XGBoost モデルをベンチマークする場合は、SageMaker Inference Recommender XGBoost
ノートブックを参照してください。 -
Inference Recommender のジョブの CloudWatch メトリクスを確認する場合は、SageMaker Inference Recommender CloudWatch メトリクス
ノートブックを参照してください。