編譯模型 (Amazon SageMaker Console) - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

編譯模型 (Amazon SageMaker Console)

您可以在 Amazon SageMaker 主控台中建立 Amazon SageMaker Neo 編譯任務。

  1. Amazon SageMaker 主控台中,選擇編譯任務 ,然後選擇建立編譯任務

    建立編譯任務。
  2. 建立編譯任務頁面的任務名稱輸入名稱。然後選擇IAM角色

    建立編譯任務頁面。
  3. 如果您沒有IAM角色,請選擇建立新角色。

    建立IAM角色位置。
  4. 建立IAM角色頁面上,選擇任何 S3 儲存貯體 ,然後選擇建立角色

    建立IAM角色頁面。
  5. Non PyTorch Frameworks

    輸入組態區段中,在模型成品位置輸入欄位中輸入URI包含模型成品的 Amazon S3 儲存貯體完整路徑。模型成品必須是壓縮的 tarball 檔案格式 (.tar.gz)。

    資料輸入組態欄位中,輸入指定輸入資料形狀的JSON字串。

    針對機器學習架構,自行選擇架構。

    輸入組態頁面。

    若要根據架構尋找輸入資料形狀的JSON字串範例,請參閱 Neo 預期的輸入資料形狀

    PyTorch Framework

    類似的說明適用於編譯 PyTorch 模型。不過,如果您接受 訓練 PyTorch 並嘗試編譯 ml_*(除 ml_inf) 目標的模型,您可以選擇指定 PyTorch 您使用的版本。

    範例輸入組態區段,顯示在何處選擇架構版本 。

    若要根據架構尋找輸入資料形狀的JSON字串範例,請參閱 Neo 預期的輸入資料形狀

    備註
    • 如果您使用 2 PyTorch .0 版或更新版本儲存模型,則資料輸入組態欄位為選用。 SageMaker Neo 會從您透過 建立的模型定義檔案中取得輸入組態 PyTorch。如需有關如何建立定義檔案的詳細資訊,請參閱「儲存模型新 SageMaker」PyTorch一節。

    • 使用 PyTorch 架構編譯ml_*執行個體時,請使用輸出組態中的編譯器選項欄位,提供模型輸入的正確資料類型 (dtype)。預設設定為 "float32"

    範例輸出組態區段。
    警告

    如果您指定導致 .pth 檔案的 Amazon S3 儲存貯體URI路徑,您將在開始編譯後收到下列錯誤: ClientError: InputConfiguration: Unable to untar input model.Please confirm the model is a tar.gz file

  6. 前往輸出組態區段。選擇要部署模型的位置。您可以將模型部署到目標裝置目標平台。目標裝置包括雲端和Edge 裝置。目標平台是指您希望執行模型的特定作業系統、架構和加速器。

    針對 S3 輸出位置,請輸入您要用於儲存模型之 S3 儲存貯體的路徑。您可以在編譯器選項區段下選擇性地以 JSON 格式新增編譯器選項

    輸出組態頁面。
  7. 檢查編譯任務啟動後的狀態。這個任務狀態可以在編譯任務頁面的最上方找到,如下方的螢幕擷取畫面所示。您也可以在狀態欄檢查其狀態。

    編譯任務狀態。
  8. 檢查編譯任務完成後的狀態。您可以在狀態欄檢查狀態,如下方的螢幕擷取畫面所示。

    編譯任務狀態。