本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用预置并发完成无服务器端点的自动扩缩后,应清理您创建的资源。这需要删除扩展策略,并从应用程序自动扩缩中注销模型。清理可以确保您不再使用的资源不会产生不必要的费用。
删除扩展策略
您可以使用 AWS Management Console、或 Application Auto Scaling API 删除扩展策略。 AWS CLI有关使用删除扩展策略的更多信息 AWS Management Console,请参阅 SageMaker AI 自动缩放文档删除扩展策略中的。
删除扩展策略 (AWS CLI)
要将扩展策略应用于模型,请使用带有以下参数的 delete-scaling-policy
AWS CLI命令:
-
--policy-name
– 扩展策略的名称。 -
--resource-id
– 变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/MyEndpoint/variant/MyVariant
。 -
--service-namespace
– 将该值设置为sagemaker
。 -
--scalable-dimension
– 将该值设置为sagemaker:variant:DesiredProvisionedConcurrency
。
以下示例从名为 MyVariant
的模型中删除名为 MyScalingPolicy
的扩展策略。
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
删除扩展策略 (Application Auto Scaling API)
要删除模型的扩展策略,请使用带有以下参数的 DeleteScalingPolicy
Application Auto Scaling API 操作:
-
PolicyName
– 扩展策略的名称。 -
ResourceId
– 变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/MyEndpoint/variant/MyVariant
。 -
ServiceNamespace
– 将该值设置为sagemaker
。 -
ScalableDimension
– 将该值设置为sagemaker:variant:DesiredProvisionedConcurrency
。
以下示例使用 Application Auto Scaling API 从名为 MyVariant
的模型中删除名为 MyScalingPolicy
的扩展策略。
POST / HTTP/1.1
Host: autoscaling.us-east-2.amazonaws.com
Accept-Encoding: identity
X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy
X-Amz-Date: 20160506T182145Z
User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8
Content-Type: application/x-amz-json-1.1
Authorization: AUTHPARAMS
{
"PolicyName": "MyScalingPolicy",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/MyEndpoint/variant/MyVariant",
"ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency",
}
取消注册模型
您可以使用 AWS Management Console、或 Application Auto Scaling API 取消注册模型。 AWS CLI
取消注册模型 (AWS CLI)
要从 Application Auto Scaling 取消注册模型,请使用带有以下参数的 deregister-scalable-target
AWS CLI命令:
-
--resource-id
– 变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/MyEndpoint/variant/MyVariant
。 -
--service-namespace
– 将该值设置为sagemaker
。 -
--scalable-dimension
– 将该值设置为sagemaker:variant:DesiredProvisionedConcurrency
。
以下示例从 Application Auto Scaling 取消注册名为 MyVariant
的模型。
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
取消注册模型 (Application Auto Scaling API)
要从 Application Auto Scaling 取消注册模型,请使用带有以下参数的 DeregisterScalableTarget
Application Auto Scaling API 操作:
-
ResourceId
– 变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/MyEndpoint/variant/MyVariant
。 -
ServiceNamespace
– 将该值设置为sagemaker
。 -
ScalableDimension
– 将该值设置为sagemaker:variant:DesiredProvisionedConcurrency
。
以下示例使用 Application Auto Scaling API 从 Application Auto Scaling 取消注册名为 MyVariant
的模型。
POST / HTTP/1.1
Host: autoscaling.us-east-2.amazonaws.com
Accept-Encoding: identity
X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget
X-Amz-Date: 20160506T182145Z
User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8
Content-Type: application/x-amz-json-1.1
Authorization: AUTHPARAMS
{
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/MyEndpoint/variant/MyVariant",
"ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency",
}
取消注册模型 (AWS Management Console)
要取消对模型(生产变型)的注册,请执行 AWS Management Console以下操作:
-
在导航面板中,选择推理。
-
选择端点以查看您的端点列表。
-
选择托管生产变体的无服务器端点。此时将出现一个包含端点设置的页面,在端点运行时系统设置部分列出了生产变体。
-
选择要取消注册的生产变体,然后选择配置自动扩缩。此时将显示配置变体自动扩展对话框。
-
选择取消注册自动扩缩。