本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
清理
使用预配置并发为无服务器端点使用自动缩放后,应清理您创建的资源。这包括删除扩展策略并从 Application Auto Scaling 中注销模型。清理可确保您不会因为不再使用的资源而产生不必要的成本。
删除扩展策略
您可以使用 AWS Management Console、或 Application Auto Scaling 删除扩展策略API。 AWS CLI有关使用删除扩展策略的更多信息 AWS Management Console,请参阅SageMaker 自动缩放文档删除扩展策略中的。
删除扩展策略 (AWS CLI)
要将扩展策略应用于模型,请使用带有以下参数的 delete-scaling-policy
AWS CLI命令:
-
--policy-name
– 扩展策略的名称。 -
--resource-id
– 变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/MyEndpoint/variant/MyVariant
。 -
--service-namespace
– 将该值设置为sagemaker
。 -
--scalable-dimension
– 将该值设置为sagemaker:variant:DesiredProvisionedConcurrency
。
以下示例从名为 MyVariant
的模型中删除名为 MyScalingPolicy
的扩展策略。
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
删除扩展策略(Application Auto ScalingAPI)
要删除模型的缩放策略,请使用带有以下参数的 App DeleteScalingPolicy
lication Auto Scaling API 操作:
-
PolicyName
– 扩展策略的名称。 -
ResourceId
– 变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/MyEndpoint/variant/MyVariant
。 -
ServiceNamespace
– 将该值设置为sagemaker
。 -
ScalableDimension
– 将该值设置为sagemaker:variant:DesiredProvisionedConcurrency
。
以下示例使用 Application Auto Scal API ing MyScalingPolicy
从名为的模型中删除名为的扩展策略MyVariant
。
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
取消注册模型
您可以在 AWS Management Console、或 Application Auto Scaling API 中取消注册模型。 AWS CLI
取消注册模型 (AWS CLI)
要从 Application Auto Scaling 取消注册模型,请使用带有以下参数的 deregister-scalable-target
AWS CLI命令:
-
--resource-id
– 变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/MyEndpoint/variant/MyVariant
。 -
--service-namespace
– 将该值设置为sagemaker
。 -
--scalable-dimension
– 将该值设置为sagemaker:variant:DesiredProvisionedConcurrency
。
以下示例从 Application Auto Scaling 取消注册名为 MyVariant
的模型。
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
注销模型(Application Auto ScalingAPI)
要从 Application Auto Scaling 中注销模型,请使用带有以下参数的 App DeregisterScalableTarget
lication Auto Scaling API 操作:
-
ResourceId
– 变体的资源标识符。对于该参数,资源类型为endpoint
,唯一标识符为变体的名称。例如endpoint/MyEndpoint/variant/MyVariant
。 -
ServiceNamespace
– 将该值设置为sagemaker
。 -
ScalableDimension
– 将该值设置为sagemaker:variant:DesiredProvisionedConcurrency
。
以下示例使用 Application Auto Scaling API 注销一个名为 MyVariant
Application Auto Scaling 的模型。
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
取消注册模型 (AWS Management Console)
要取消对模型(生产变型)的注册,请执行 AWS Management Console以下操作:
-
在导航面板中,选择推理。
-
选择端点以查看您的端点列表。
-
选择托管生产变体的无服务器端点。此时将出现一个包含端点设置的页面,在端点运行时系统设置部分列出了生产变体。
-
选择要取消注册的生产变体,然后选择配置自动扩缩。此时将显示配置变体自动扩展对话框。
-
选择取消注册自动扩缩。