清除 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

清除

使用 佈建並行針對無伺服器端點使用自動擴展之後,您應該清除您建立的資源。這包括刪除擴展政策,並從 Application Auto Scaling 取消註冊模型。清理可確保您不會為不再使用的資源產生不必要的成本。

刪除擴展政策

您可以使用 AWS Management Console、 AWS CLI或 Application Auto Scaling 刪除擴展政策API。如需使用 刪除擴展政策的詳細資訊 AWS Management Console,請參閱 自動擴展文件 刪除擴展政策 中的 。 SageMaker

刪除擴展政策 (AWS CLI)

若要將擴展政策套用到您的模型,請使用 delete-scaling-policy AWS CLI命令搭配下列參數:

  • --policy-name – 擴展政策的名稱。

  • --resource-id — 變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如 endpoint/MyEndpoint/variant/MyVariant

  • --service-namespace – 將此值設定為 sagemaker

  • --scalable-dimension – 將此值設定為 sagemaker:variant:DesiredProvisionedConcurrency

下列的範例從名為 MyVariant 的模型中,刪除了名為 MyScalingPolicy 的擴展政策。

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

刪除擴展政策 (應用程式Auto ScalingAPI)

若要刪除模型的擴展政策,請使用 DeleteScalingPolicy Application Auto Scaling API動作搭配下列參數:

  • PolicyName – 擴展政策的名稱。

  • ResourceId — 變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如 endpoint/MyEndpoint/variant/MyVariant

  • ServiceNamespace – 將此值設定為 sagemaker

  • ScalableDimension – 將此值設定為 sagemaker:variant:DesiredProvisionedConcurrency

下列範例使用 Application Auto ScalingMyScalingPolicy,從名為 的模型API中刪除名為 的擴展政策MyVariant

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

取消註冊模型

您可以使用 AWS Management Console、 AWS CLI或 Application Auto Scaling 取消註冊模型API。

取消註冊模型 (AWS CLI)

若要取消註冊應用程式自動擴展模型,請使用 deregister-scalable-target AWS CLI; 命令並搭配下列參數:

  • --resource-id — 變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如 endpoint/MyEndpoint/variant/MyVariant

  • --service-namespace – 將此值設定為 sagemaker

  • --scalable-dimension – 將此值設定為 sagemaker:variant:DesiredProvisionedConcurrency

以下範例可看到如何從應用程式自動擴展取消註冊名為 MyVariant 的模型。

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

取消註冊模型 (應用程式Auto ScalingAPI)

若要從 Application Auto Scaling 取消註冊模型,請使用 DeregisterScalableTarget Application Auto Scaling API動作搭配下列參數:

  • ResourceId — 變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如 endpoint/MyEndpoint/variant/MyVariant

  • ServiceNamespace – 將此值設定為 sagemaker

  • ScalableDimension – 將此值設定為 sagemaker:variant:DesiredProvisionedConcurrency

下列範例使用 Application Auto Scaling MyVariant API取消註冊名為 Application Auto Scaling 的模型。

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

取消註冊模型 (AWS Management Console)

若要使用 取消註冊模型 (生產變體) AWS Management Console:

  1. 開啟 Amazon SageMaker 主控台

  2. 在導覽窗格中,選擇 Inference (推論)。

  3. 選擇 Endpoints (端點) 以檢視端點清單。

  4. 選擇託管生產變體的無伺服器端點。畫面將顯示一個包含端點設定的頁面,其中生產變體會列在 Endpoint runtime settings (端點執行期設定)區段下方。

  5. 選取您要取消註冊的生產變體,然後選擇 Configure auto scaling (設定 Auto Scaling)。畫面會顯示 Configure variant automatic scaling (設定變體自動擴展) 對話框。

  6. 選擇取消登錄自動擴展