將模型部署到端點 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將模型部署到端點

您可以在 Amazon SageMaker Canvas 中將模型部署到端點以進行預測。SageMaker AI 為您提供 ML 基礎設施,讓您使用您選擇的運算執行個體在端點上託管模型。然後您可以調用端點 (發送預測請求) 並從模型中獲取即時預測。您可以透過此功能在生產環境中使用模型來回應傳入請求,並且可以將模型與現有應用程式和工作流程整合。

若要開始使用,您應該要部署模型。您可以部署已建立的自訂模型版本、Amazon SageMaker JumpStart 基礎模型,以及微調的 JumpStart 基礎模型。如需在 Canvas 中建立模型的更多相關資訊,請參閱自訂模型的運作方式。如需 Canvas 中 JumpStart 基礎模型的詳細資訊,請參閱SageMaker Canvas 中的生成式 AI 基礎模型

檢閱下列許可管理章節,然後在部署模型區段中開始建立新的部署。

許可管理

根據預設,您有將模型部署至 SageMaker AI Hosting 端點的許可。SageMaker AI 會透過 AmazonSageMakerCanvasFullAccess 政策授予所有新 Canvas 使用者設定檔的這些許可,該政策會連接到 AWS 託管 Canvas 應用程式的 SageMaker AI 網域的 IAM 執行角色。

如果您的 Canvas 管理員正在設定新的網域或使用者設定檔,當他們設定網域並遵循 中的必要說明時設定 Amazon SageMaker Canvas 的先決條件,SageMaker AI 會透過啟用 Canvas 模型的直接部署選項來開啟模型部署許可,該選項預設為啟用。

Canvas 管理員也可以在使用者設定檔等級上管理模型部署許可。例如,如果管理員在設定網域時不想將模型部署許可授予所有使用者設定檔,他們可以在建立網域後將許可授予特定使用者。

下列程序說明如何修改特定使用者設定檔的模型部署許可:

  1. 在 https://https://console.aws.amazon.com/sagemaker/ 開啟 SageMaker AI 主控台。

  2. 在左側導覽窗格中,選擇管理員組態

  3. Admin configurations (管理員組態) 下,選擇 Domains (網域)。

  4. 從網域清單中,選取使用者設定檔的網域。

  5. 網域詳細資訊頁面上,選取使用者設定檔索引標籤。

  6. 選擇您的使用者設定檔

  7. 在使用者設定檔的頁面上,選取應用程式組態索引標籤。

  8. Canvas 區段中,選擇編輯

  9. ML Ops 組態區段中,開啟啟用 Canvas 模型的直接部署切換以啟用部署許可。

  10. 選擇提交以儲存網域設定的變更。

使用者描述檔現在應該具有模型部署許可。

將許可授予網域或使用者設定檔之後,請確定使用者登出其 Canvas 應用程式,然後重新登入以套用許可變更。

部署模型

若要開始部署模型,請在 Canvas 中建立新部署,並指定要與機器學習 (ML) 基礎設施一起部署的模型版本,例如您想要用來託管模型的運算執行個體的類型和數目。

Canvas 根據您的模型類型建議預設的執行個體類型和數量,或者您可以在 Amazon SageMaker AI 定價頁面上進一步了解各種 SageMaker AI 執行個體類型。 Amazon SageMaker 當您的端點處於作用中狀態時,會根據 SageMaker AI 執行個體定價向您收費。

部署 JumpStart 基礎模型時,您也可以選擇指定部署時間的長度。您可以將模型無限期部署到端點 (表示端點在您刪除部署之前處於作用中狀態)。或者,如果您只需要短期的端點,並且想要降低成本,您可以在指定的時間內將模型部署到端點,之後 SageMaker AI 會為您關閉端點。

注意

如果您在指定的時間內部署模型,請在端點持續時間內保持登入 Canvas 應用程式。如果您登出或刪除應用程式,則 Canvas 無法在指定的時間關閉端點。

在模型部署至 SageMaker AI 託管即時推論端點後,您可以開始叫用端點來進行預測。

有多種不同的方式可讓您從 Canvas 應用程式部署模型。您可以透過下列任一種方法來存取模型部署選項:

  • 在 Canvas 應用程式的我的模型頁面上,選擇您要部署的模型。然後,從模型的版本頁面中,選擇模型版本旁的更多選項圖示 ( Vertical ellipsis icon representing a menu or more options. ),然後選取部署

  • 在模型版本的詳細資訊頁面上,在分析索引標籤上,選擇部署選項。

  • 在模型版本的詳細資訊頁面上,在預測索引標籤上,選擇頁面頂端的更多選項圖示 ( Vertical ellipsis icon representing a menu or more options. ),然後選取部署

  • 在 Canvas 應用程式的 ML Ops 頁面上,選擇部署索引標籤,然後選擇建立部署

  • 對於 JumpStart 基礎模型和微調的基礎模型,請前往 Canvas 應用程式的Ready-to-use型模型頁面。選擇產生、擷取與摘要內容。然後,尋找您要部署的 JumpStart 基礎模型或微調的基礎模型。選擇模型,然後在模型的聊天頁面上選擇部署按鈕。

這些方法都會開啟 Deploy model (部署模型) 側邊面板,您可以在其中指定模型的部署組態。若要從此面板部署模型,請執行下列動作:

  1. (選用) 如果您要從 ML Ops 頁面建立部署,您可以選擇選取模型和版本。使用下拉式清單功能表選取您要部署的模型和模型版本。

  2. Deployment Name (部署名稱) 欄位中輸入名稱。

  3. (僅適用於 JumpStart 基礎模型和微調的基礎模型) 選擇部署長度。選取無限期以讓端點保持作用中狀態,直到您關閉為止,或選取指定長度,然後輸入您要讓端點保持作用中狀態的期間。

  4. 針對執行個體類型,SageMaker AI 會偵測適合您模型的預設執行個體類型和號碼。但是,您可以變更想要用於託管模型的執行個體類型。

    注意

    如果您 AWS 帳戶中所選執行個體類型的執行個體配額用完,您可以請求增加配額。如需預設配額以及如何請求增加的詳細資訊,請參閱 AWS 一般參考指南中的 Amazon SageMaker AI 端點和配額

  5. 針對Instance count (執行個體計數),您可以設定用於端點的作用中執行個體數目。SageMaker AI 偵測到適合您模型的預設號碼,但您可以變更此號碼。

  6. 當您準備好部署模型時,請選擇 Deploy (部署)。

您的模型現在應該部署到端點。