清理 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

清理

使用预配置并发为无服务器端点使用自动缩放后,应清理您创建的资源。这包括删除扩展策略并从 Application Auto Scaling 中注销模型。清理可确保您不会因为不再使用的资源而产生不必要的成本。

删除扩展策略

您可以使用 AWS Management Console、或 Application Auto Scaling 删除扩展策略API。 AWS CLI有关使用删除扩展策略的更多信息 AWS Management Console,请参阅SageMaker 自动缩放文档删除扩展策略中的。

删除扩展策略 (AWS CLI)

要将扩展策略应用于模型,请使用带有以下参数的 delete-scaling-policy AWS CLI命令:

  • --policy-name – 扩展策略的名称。

  • --resource-id – 变体的资源标识符。对于该参数,资源类型为 endpoint,唯一标识符为变体的名称。例如 endpoint/MyEndpoint/variant/MyVariant

  • --service-namespace – 将该值设置为 sagemaker

  • --scalable-dimension – 将该值设置为 sagemaker:variant:DesiredProvisionedConcurrency

以下示例从名为 MyVariant 的模型中删除名为 MyScalingPolicy 的扩展策略。

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

删除扩展策略(Application Auto ScalingAPI)

要删除模型的缩放策略,请使用带有以下参数的 App DeleteScalingPolicy lication Auto Scaling API 操作:

  • PolicyName – 扩展策略的名称。

  • ResourceId – 变体的资源标识符。对于该参数,资源类型为 endpoint,唯一标识符为变体的名称。例如 endpoint/MyEndpoint/variant/MyVariant

  • ServiceNamespace – 将该值设置为 sagemaker

  • ScalableDimension – 将该值设置为 sagemaker:variant:DesiredProvisionedConcurrency

以下示例使用 Application Auto Scal API ing MyScalingPolicy 从名为的模型中删除名为的扩展策略MyVariant

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

取消注册模型

您可以在 AWS Management Console、或 Application Auto Scaling API 中取消注册模型。 AWS CLI

取消注册模型 (AWS CLI)

要从 Application Auto Scaling 取消注册模型,请使用带有以下参数的 deregister-scalable-target AWS CLI命令:

  • --resource-id – 变体的资源标识符。对于该参数,资源类型为 endpoint,唯一标识符为变体的名称。例如 endpoint/MyEndpoint/variant/MyVariant

  • --service-namespace – 将该值设置为 sagemaker

  • --scalable-dimension – 将该值设置为 sagemaker:variant:DesiredProvisionedConcurrency

以下示例从 Application Auto Scaling 取消注册名为 MyVariant 的模型。

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

注销模型(Application Auto ScalingAPI)

要从 Application Auto Scaling 中注销模型,请使用带有以下参数的 App DeregisterScalableTarget lication Auto Scaling API 操作:

  • ResourceId – 变体的资源标识符。对于该参数,资源类型为 endpoint,唯一标识符为变体的名称。例如 endpoint/MyEndpoint/variant/MyVariant

  • ServiceNamespace – 将该值设置为 sagemaker

  • ScalableDimension – 将该值设置为 sagemaker:variant:DesiredProvisionedConcurrency

以下示例使用 Application Auto Scaling API 注销一个名为 MyVariant Application Auto Scaling 的模型。

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

取消注册模型 (AWS Management Console)

要取消对模型(生产变型)的注册,请执行 AWS Management Console以下操作:

  1. 打开 Amazon SageMaker 控制台

  2. 在导航面板中,选择推理

  3. 选择端点以查看您的端点列表。

  4. 选择托管生产变体的无服务器端点。此时将出现一个包含端点设置的页面,在端点运行时系统设置部分列出了生产变体。

  5. 选择要取消注册的生产变体,然后选择配置自动扩缩。此时将显示配置变体自动扩展对话框。

  6. 选择取消注册自动扩缩