モデルの登録 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

モデルの登録

モデルにスケーリングポリシーを追加する前に、まずモデルを auto Scaling に登録し、モデルのスケーリング制限を定義する必要があります。

以下の手順では、() またはアプリケーションの auto Scaling API を使用してモデル AWS Command Line Interface (プロダクションバリアントAWS CLI) を自動スケーリングに登録する方法について説明します。

モデルの登録 (AWS CLI)

プロダクションバリアントを登録するには、register-scalable-target以下のパラメーターを指定してコマンドを実行します。

  • --service-namespace - この値は sagemaker に設定します。

  • --resource-id - モデルのリソース識別子 (具体的には本番稼働用バリアント)。このパラメータでは、リソースタイプは endpoint で、一意の識別子は本番稼働用バリアントの名前です。例えば endpoint/my-endpoint/variant/my-variant です。

  • --scalable-dimension - この値は sagemaker:variant:DesiredInstanceCount に設定します。

  • --min-capacity— 最小インスタンス数。この値は 1 以上、および max-capacity に指定された値以下である必要があります。

  • --max-capacity— インスタンスの最大数。この値は 1 以上、および min-capacity に指定された値以上である必要があります。

次の例はmy-variantmy-endpointエンドポイントで実行されるというバリアントを登録する方法を示しています。このバリアントは、1 ~ 8 個のインスタンスになるように動的にスケーリングできます。

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

モデルの登録 (Application Auto Scaling API)

モデルをアプリケーションの Auto Scaling に登録するには、RegisterScalableTarget以下のパラメータを指定してApplication Auto Scaling API アクションを使用します。

  • ServiceNamespace - この値は sagemaker に設定します。

  • ResourceID - 本番稼働用バリアントのリソース識別子。このパラメータでは、リソースタイプは endpoint で、一意の識別子はバリアントの名前です。例えば、endpoint/my-endpoint/variant/my-variant

  • ScalableDimension - この値は sagemaker:variant:DesiredInstanceCount に設定します。

  • MinCapacity—最小インスタンス数。この値は 1 以上、および MaxCapacity に指定された値以下である必要があります。

  • MaxCapacity— インスタンスの最大数。この値は 1 以上、および MinCapacity に指定された値以上である必要があります。

次の例はmy-variantmy-endpointエンドポイントで実行されるというバリアントを登録する方法を示しています。このバリアントは、1 ~ 8 個のインスタンスを使用するように動的にスケーリングできます。

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }