注册模型
在为模型添加扩展策略之前,首先必须将模型注册为自动扩缩,并定义模型的扩展限制。
以下步骤将介绍如何使用 AWS Command Line Interface (AWS CLI) 或应用程序自动扩缩 API 注册模型(生产变体)以进行自动扩缩。
注册模型 (AWS CLI)
要注册生产变体,请使用 register-scalable-target 命令并输入以下参数:
-
--service-namespace
– 将该值设置为sagemaker
。 -
--resource-id
– 模型(特别是生产变体)的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为生产变体的名称。例如,endpoint/
。my-endpoint
/variant/my-variant
-
--scalable-dimension
– 将该值设置为sagemaker:variant:DesiredInstanceCount
。 -
--min-capacity
:最小实例数。必须将此值设置为至少 1,并且必须等于或小于为max-capacity
指定的值。 -
--max-capacity
:最大实例数。必须将此值设置为至少 1,并且必须等于或大于为min-capacity
指定的值。
下面的示例展示了如何注册一个名为
的变量,该变量运行在 my-variant
端点上,可动态扩展为 1 到 8 个实例。my-endpoint
aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity1
\ --max-capacity8
注册模型 (Application Auto Scaling API)
要使用应用程序自动扩缩功能注册模型,请使用 RegisterScalableTarget 应用程序自动扩缩 API 操作,并设置以下参数:
-
ServiceNamespace
– 将该值设置为sagemaker
。 -
ResourceID
– 生产变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/
。my-endpoint
/variant/my-variant
-
ScalableDimension
– 将该值设置为sagemaker:variant:DesiredInstanceCount
。 -
MinCapacity
:最小实例数。必须将此值设置为至少 1,并且必须等于或小于为MaxCapacity
指定的值。 -
MaxCapacity
:最大实例数。必须将此值设置为至少 1,并且必须等于或大于为MinCapacity
指定的值。
下面的示例展示了如何注册一个名为
的变量,该变量在 my-variant
端点上运行,可动态扩展为使用 1 到 8 个实例。my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/
my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity":1
, "MaxCapacity":8
}