本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
新增或移除模型
您可以將額外的模型部署到多模型端點,並立即透過該端點進行調用。新增模型時,您不需要更新或關閉端點,因此可避免逐一為各個新模型建立和執行個別端點的費用。對於 和 GPU後端多模型端點,新增CPU和移除模型的程序相同。
SageMaker 當執行個體達到記憶體容量時,AI 會從容器卸載未使用的模型,且需要將更多模型下載到容器。當磁碟區達到容量且需要下載新模型時, SageMaker AI 也會從執行個體儲存磁碟區中刪除未使用的模型成品。對新增模型的第一個調用會需要比較久的時間,因為端點需要時間來將模型從 S3 下載到託管端點之執行個體中的容器記憶體
執行端點後,請將一組新的模型成品複製到您要儲存模型的 Amazon S3 位置。
# Add an AdditionalModel to the endpoint and exercise it aws s3 cp AdditionalModel.tar.gz s3://amzn-s3-demo-bucket/path/to/artifacts/
重要
若要更新模型,請像新增模型的做法一樣,繼續進行相關步驟。使用新的唯一名稱。請勿覆寫 Amazon S3 的模型成品,因為舊版模型可能仍載入於容器或端點的執行個體儲存磁碟區。接著,對新模型的調用就能調用舊版模型。
一旦儲存在 S3 中,用戶端應用程式即可從其他目標模型中請求取得預測。
response = runtime_sagemaker_client.invoke_endpoint( EndpointName=
'<ENDPOINT_NAME>'
, ContentType='text/csv', TargetModel='AdditionalModel.tar.gz', Body=body)
若要從多模型端點中刪除模型,請停止從用戶端中調用模型,並將其從儲存模型成品的 S3 位置中移除。