本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
清除
使用 佈建並行針對無伺服器端點使用自動擴展之後,您應該清除您建立的資源。這包括刪除擴展政策,並從 Application Auto Scaling 取消註冊模型。清理可確保您不會為不再使用的資源產生不必要的成本。
刪除擴展政策
您可以使用 AWS Management Console、 AWS CLI或 Application Auto Scaling 刪除擴展政策API。如需使用 刪除擴展政策的詳細資訊 AWS Management Console,請參閱 自動擴展文件 刪除擴展政策 中的 。 SageMaker
刪除擴展政策 (AWS CLI)
若要將擴展政策套用到您的模型,請使用 delete-scaling-policy
AWS CLI命令搭配下列參數:
-
--policy-name
– 擴展政策的名稱。 -
--resource-id
— 變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant
。 -
--service-namespace
– 將此值設定為sagemaker
。 -
--scalable-dimension
– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency
。
下列的範例從名為 MyVariant
的模型中,刪除了名為 MyScalingPolicy
的擴展政策。
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
刪除擴展政策 (應用程式Auto ScalingAPI)
若要刪除模型的擴展政策,請使用 DeleteScalingPolicy
Application Auto Scaling API動作搭配下列參數:
-
PolicyName
– 擴展政策的名稱。 -
ResourceId
— 變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant
。 -
ServiceNamespace
– 將此值設定為sagemaker
。 -
ScalableDimension
– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency
。
下列範例使用 Application Auto ScalingMyScalingPolicy
,從名為 的模型API中刪除名為 的擴展政策MyVariant
。
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
取消註冊模型
您可以使用 AWS Management Console、 AWS CLI或 Application Auto Scaling 取消註冊模型API。
取消註冊模型 (AWS CLI)
若要取消註冊應用程式自動擴展模型,請使用 deregister-scalable-target
AWS CLI; 命令並搭配下列參數:
-
--resource-id
— 變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant
。 -
--service-namespace
– 將此值設定為sagemaker
。 -
--scalable-dimension
– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency
。
以下範例可看到如何從應用程式自動擴展取消註冊名為 MyVariant
的模型。
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
取消註冊模型 (應用程式Auto ScalingAPI)
若要從 Application Auto Scaling 取消註冊模型,請使用 DeregisterScalableTarget
Application Auto Scaling API動作搭配下列參數:
-
ResourceId
— 變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant
。 -
ServiceNamespace
– 將此值設定為sagemaker
。 -
ScalableDimension
– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency
。
下列範例使用 Application Auto Scaling MyVariant
API取消註冊名為 Application Auto Scaling 的模型。
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
取消註冊模型 (AWS Management Console)
若要使用 取消註冊模型 (生產變體) AWS Management Console:
-
開啟 Amazon SageMaker 主控台
。 -
在導覽窗格中,選擇 Inference (推論)。
-
選擇 Endpoints (端點) 以檢視端點清單。
-
選擇託管生產變體的無伺服器端點。畫面將顯示一個包含端點設定的頁面,其中生產變體會列在 Endpoint runtime settings (端點執行期設定)區段下方。
-
選取您要取消註冊的生產變體,然後選擇 Configure auto scaling (設定 Auto Scaling)。畫面會顯示 Configure variant automatic scaling (設定變體自動擴展) 對話框。
-
選擇取消登錄自動擴展。