管道概觀 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

管道概觀

Amazon SageMaker AI 管道是定向非循環圖形 (DAG) 中的一系列互連步驟,使用drag-and-drop UI 或管道 SDK 定義。您也可以使用管道定義 JSON 結構描述來建置管道。此 DAG JSON 定義提供管道每個步驟之間需求和關係的相關資訊。管道的 DAG 結構由步驟之間的資料相依性決定。當一個步驟的輸出的内容作為輸入傳遞給另一個步驟時,就會建立這些資料相依性。下列影像是管道 DAG 範例:

範例管道導向非循環圖形 (DAG)。
範例 DAG 包含下列步驟:
  1. AbaloneProcess處理步驟的執行個體,會對用於訓練的資料執行預先處理指令碼。例如,指令碼可以填入遺失值、標準化數值資料,或將資料分割成訓練、驗證和測試資料集。

  2. AbaloneTrain訓練步驟的執行個體,可設定超參數,並從預先處理的輸入資料訓練模型。

  3. AbaloneEval處理步驟的另一個執行個體, 會評估模型的準確性。此步驟顯示資料相依性的範例:此步驟使用 的測試資料集輸出AbaloneProcess

  4. AbaloneMSECond條件步驟的執行個體,在此範例中,會檢查以確保模型評估mean-square-error結果低於特定限制。如果模型不符合條件,則管道執行會停止。

  5. 管道執行會繼續進行下列步驟:

    1. AbaloneRegisterModel,其中 SageMaker AI 呼叫 RegisterModel 步驟,將模型註冊為 Amazon SageMaker Model Registry 的版本化模型套件群組。

    2. AbaloneCreateModel,其中 SageMaker AI 呼叫 CreateModel 步驟來建立模型以準備批次轉換。在 中AbaloneTransform,SageMaker AI 呼叫轉換步驟,以在您指定的資料集上產生模型預測。

下列主題說明基本管道概念。有關描述實現這些概念的教學課程,請參閱管道動作