執行管道

焦點模式

執行管道 - Amazon SageMaker AI

將管道的步驟定義為導向無環圖 (DAG) 之後，您可以執行管道，以執行 DAG 中定義的步驟。下列逐步解說說明如何使用 Amazon SageMaker Studio 中的drag-and-drop式視覺化編輯器或 Amazon SageMaker Python SDK 來執行 Amazon SageMaker AI 管道。

若要開始新的管道執行，請執行下列動作：

Studio

依照啟動 Amazon SageMaker Studio 中的指示開啟 SageMaker Studio。 Amazon SageMaker
在左側導覽窗格中，選取管道。
（選用）若要依名稱篩選管道清單，請在搜尋欄位中輸入完整或部分管道名稱。
選取管道名稱。
選擇執行索引標籤。
輸入或更新下列必填資訊：
- 名稱 – 區域中帳戶的唯一名稱 AWS 。
- 描述 – 執行的選用描述。
- ProcessingInstanceType – 用於處理任務的 Amazon EC2 執行個體類型。
- TrainingInstanceType – 用於訓練任務的 Amazon EC2 執行個體類型
- InputData – 輸入資料的 Amazon S3 URI。
- PreprocessScript – 預先處理指令碼的 Amazon S3 URI。
- EvaluateScript – 模型評估指令碼的 Amazon S3 URI。
- AccuracyConditionThreshold - 將模型註冊到登錄檔時要達到的模型準確度閾值。
- ModelGroup – 要註冊模型的登錄檔。
- MaximumParallelTrainingJobs – 要平行執行的訓練任務數目上限。
- MaximumTrainingJobs – 要執行的訓練任務數目上限。
選擇建立。

注意

如果您的管道失敗，狀態橫幅會顯示失敗狀態。對失敗步驟進行故障診斷後，請在狀態橫幅上選擇重試，以從該步驟繼續執行管道。

Studio Classic

登入 Amazon SageMaker Studio Classic。如需詳細資訊，請參閱啟動 Amazon SageMaker Studio Classic。
在 Studio Classic 邊欄中，選擇首頁圖示 () 。
從功能表中選取管道。
若要依名稱縮小管道清單，請在搜尋欄位中輸入完整或部分管道名稱。
選取管道名稱。
從執行清單的執行或圖表標籤中，選擇建立執行。
輸入或更新下列必填資訊：
- 名稱 – 在 AWS 區域中，此名稱必須是您的帳戶獨有的。
- 處理執行個體計數 – 用於處理的執行個體數目。
- 模型批准狀態 – 供您方便參考。
- InputDataUrl – 輸入資料的 Amazon S3 URI。
選擇 開始使用。

管道執行後，您可以在狀態橫幅上選擇檢視詳細資訊，以檢視執行的詳細資訊。

若要停止執行，請在狀態橫幅上選擇停止。若要從停止的位置繼續執行，請在狀態橫幅上選擇繼續。

注意

如果您的管道失敗，狀態橫幅會顯示失敗狀態。對失敗步驟進行故障診斷後，請在狀態橫幅上選擇重試，以從該步驟繼續執行管道。

執行管道（管道設計工具）

若要開始新的管道執行，請執行下列動作：

Studio

依照啟動 Amazon SageMaker Studio 中的指示開啟 SageMaker Studio。 Amazon SageMaker
在左側導覽窗格中，選取管道。
（選用）若要依名稱篩選管道清單，請在搜尋欄位中輸入完整或部分管道名稱。
選取管道名稱。
選擇執行索引標籤。
輸入或更新下列必填資訊：
- 名稱 – 區域中帳戶的唯一名稱 AWS 。
- 描述 – 執行的選用描述。
- ProcessingInstanceType – 用於處理任務的 Amazon EC2 執行個體類型。
- TrainingInstanceType – 用於訓練任務的 Amazon EC2 執行個體類型
- InputData – 輸入資料的 Amazon S3 URI。
- PreprocessScript – 預先處理指令碼的 Amazon S3 URI。
- EvaluateScript – 模型評估指令碼的 Amazon S3 URI。
- AccuracyConditionThreshold - 將模型註冊到登錄檔時要達到的模型準確度閾值。
- ModelGroup – 要註冊模型的登錄檔。
- MaximumParallelTrainingJobs – 要平行執行的訓練任務數目上限。
- MaximumTrainingJobs – 要執行的訓練任務數目上限。
選擇建立。

注意

如果您的管道失敗，狀態橫幅會顯示失敗狀態。對失敗步驟進行故障診斷後，請在狀態橫幅上選擇重試，以從該步驟繼續執行管道。

Studio Classic

登入 Amazon SageMaker Studio Classic。如需詳細資訊，請參閱啟動 Amazon SageMaker Studio Classic。
在 Studio Classic 邊欄中，選擇首頁圖示 () 。
從功能表中選取管道。
若要依名稱縮小管道清單，請在搜尋欄位中輸入完整或部分管道名稱。
選取管道名稱。
從執行清單的執行或圖表標籤中，選擇建立執行。
輸入或更新下列必填資訊：
- 名稱 – 在 AWS 區域中，此名稱必須是您的帳戶獨有的。
- 處理執行個體計數 – 用於處理的執行個體數目。
- 模型批准狀態 – 供您方便參考。
- InputDataUrl – 輸入資料的 Amazon S3 URI。
選擇 開始使用。

管道執行後，您可以在狀態橫幅上選擇檢視詳細資訊，以檢視執行的詳細資訊。

若要停止執行，請在狀態橫幅上選擇停止。若要從停止的位置繼續執行，請在狀態橫幅上選擇繼續。

注意

如果您的管道失敗，狀態橫幅會顯示失敗狀態。對失敗步驟進行故障診斷後，請在狀態橫幅上選擇重試，以從該步驟繼續執行管道。

anchor anchor

依照啟動 Amazon SageMaker Studio 中的指示開啟 SageMaker Studio。 Amazon SageMaker
在左側導覽窗格中，選取管道。
（選用）若要依名稱篩選管道清單，請在搜尋欄位中輸入完整或部分管道名稱。
選取管道名稱。
選擇執行索引標籤。
輸入或更新下列必填資訊：
- 名稱 – 區域中帳戶的唯一名稱 AWS 。
- 描述 – 執行的選用描述。
- ProcessingInstanceType – 用於處理任務的 Amazon EC2 執行個體類型。
- TrainingInstanceType – 用於訓練任務的 Amazon EC2 執行個體類型
- InputData – 輸入資料的 Amazon S3 URI。
- PreprocessScript – 預先處理指令碼的 Amazon S3 URI。
- EvaluateScript – 模型評估指令碼的 Amazon S3 URI。
- AccuracyConditionThreshold - 將模型註冊到登錄檔時要達到的模型準確度閾值。
- ModelGroup – 要註冊模型的登錄檔。
- MaximumParallelTrainingJobs – 要平行執行的訓練任務數目上限。
- MaximumTrainingJobs – 要執行的訓練任務數目上限。
選擇建立。

注意

如果您的管道失敗，狀態橫幅會顯示失敗狀態。對失敗步驟進行故障診斷後，請在狀態橫幅上選擇重試，以從該步驟繼續執行管道。

使用 SageMaker AI Python SDK 建立管道定義之後，您可以將其提交至 SageMaker AI 以開始執行。下列教學課程展示如何提交管道、開始執行、檢查執行的結果，以及刪除管道。

先決條件

本教學課程要求如下：

SageMaker 筆記本執行個體。
管道管道定義。本教學課程假設您使用的完成定義管道教學課程後建立的管道定義。

第 1 步：啟動管道

首先，您需要啟動管道。

啟動管道

檢查 JSON 管道定義，以確保其格式正確。
```
import json

json.loads(pipeline.definition())
```
將管道定義提交至管道服務，以在管道不存在時建立管道，或在管道不存在時更新管道。管道會使用傳入的角色來建立步驟中定義的所有任務。
```
pipeline.upsert(role_arn=role)
```
啟動管道執行。
```
execution = pipeline.start()
```

第 2 步：檢查管道執行

接下來，您需要檢查管道的執行情況。

檢查管道執行

描述管道執行狀態，以確保已成功建立和啟動管道。
```
execution.describe()
```
等候執行完成。
```
execution.wait()
```

列出執行步驟及狀態。


execution.list_steps()

您的輸出看起來應如以下所示：


[{'StepName': 'AbaloneTransform',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 41, 27, 870000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 45, 50, 492000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'TransformJob': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:transform-job/pipelines-cfvy1tjuxdq8-abalonetransform-ptyjoef3jy'}}},
 {'StepName': 'AbaloneRegisterModel',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 41, 26, 929000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 41, 28, 15000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'RegisterModel': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:model-package/abalonemodelpackagegroupname/1'}}},
 {'StepName': 'AbaloneCreateModel',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 41, 26, 895000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 41, 27, 708000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'Model': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:model/pipelines-cfvy1tjuxdq8-abalonecreatemodel-jl94rai0ra'}}},
 {'StepName': 'AbaloneMSECond',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 41, 25, 558000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 41, 26, 329000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'Condition': {'Outcome': 'True'}}},
 {'StepName': 'AbaloneEval',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 37, 34, 767000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 41, 18, 80000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'ProcessingJob': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:processing-job/pipelines-cfvy1tjuxdq8-abaloneeval-zfraozhmny'}}},
 {'StepName': 'AbaloneTrain',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 34, 55, 867000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 37, 34, 34000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'TrainingJob': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:training-job/pipelines-cfvy1tjuxdq8-abalonetrain-tavd6f3wdf'}}},
 {'StepName': 'AbaloneProcess',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 30, 27, 160000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 34, 48, 390000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'ProcessingJob': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:processing-job/pipelines-cfvy1tjuxdq8-abaloneprocess-mgqyfdujcj'}}}]

管道執行完成後，從 Amazon S3 下載產生的 evaluation.json 檔案以檢查報告。


evaluation_json = sagemaker.s3.S3Downloader.read_file("{}/evaluation.json".format(
    step_eval.arguments["ProcessingOutputConfig"]["Outputs"][0]["S3Output"]["S3Uri"]
))
json.loads(evaluation_json)

第 3 步：取代管道執行的預設參數

您可以透過指定不同的管道參數來覆寫預設值，來啟動管道的額外執行。

覆寫預設參數

建立管道執行。這會在模型批准狀態覆寫設為 “已批准” 的情況下啟動另一個管道執行。這意味著透過 RegisterModel 步驟產生的模型套件版本會自動準備好透過 CI/CD 管道進行部署，例如使用 SageMaker Projects。如需詳細資訊，請參閱使用 SageMaker 專案的 MLOps 自動化。
```
execution = pipeline.start(
    parameters=dict(
        ModelApprovalStatus="Approved",
    )
)
```
等候執行完成。
```
execution.wait()
```
列出執行步驟及狀態。
```
execution.list_steps()
```

管道執行完成後，從 Amazon S3 下載產生的 evaluation.json 檔案以檢查報告。


evaluation_json = sagemaker.s3.S3Downloader.read_file("{}/evaluation.json".format(
    step_eval.arguments["ProcessingOutputConfig"]["Outputs"][0]["S3Output"]["S3Uri"]
))
json.loads(evaluation_json)

第 4 步：停止並刪除管道執行

管道完成後，您可以停止任何正在進行的執行並刪除管道。

停止和刪除管道執行

停止管道執行。
```
execution.stop()
```
刪除管道。
```
pipeline.delete()
```

執行管道 (SageMaker Python SDK)

主題

先決條件
第 1 步：啟動管道
第 2 步：檢查管道執行
第 3 步：取代管道執行的預設參數
第 4 步：停止並刪除管道執行

先決條件

本教學課程要求如下：

SageMaker 筆記本執行個體。
管道管道定義。本教學課程假設您使用的完成定義管道教學課程後建立的管道定義。

第 1 步：啟動管道

首先，您需要啟動管道。

啟動管道

檢查 JSON 管道定義，以確保其格式正確。
```
import json

json.loads(pipeline.definition())
```
將管道定義提交至管道服務，以在管道不存在時建立管道，或在管道不存在時更新管道。管道會使用傳入的角色來建立步驟中定義的所有任務。
```
pipeline.upsert(role_arn=role)
```
啟動管道執行。
```
execution = pipeline.start()
```

第 2 步：檢查管道執行

接下來，您需要檢查管道的執行情況。

檢查管道執行

描述管道執行狀態，以確保已成功建立和啟動管道。
```
execution.describe()
```
等候執行完成。
```
execution.wait()
```

列出執行步驟及狀態。


execution.list_steps()

您的輸出看起來應如以下所示：


[{'StepName': 'AbaloneTransform',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 41, 27, 870000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 45, 50, 492000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'TransformJob': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:transform-job/pipelines-cfvy1tjuxdq8-abalonetransform-ptyjoef3jy'}}},
 {'StepName': 'AbaloneRegisterModel',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 41, 26, 929000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 41, 28, 15000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'RegisterModel': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:model-package/abalonemodelpackagegroupname/1'}}},
 {'StepName': 'AbaloneCreateModel',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 41, 26, 895000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 41, 27, 708000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'Model': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:model/pipelines-cfvy1tjuxdq8-abalonecreatemodel-jl94rai0ra'}}},
 {'StepName': 'AbaloneMSECond',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 41, 25, 558000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 41, 26, 329000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'Condition': {'Outcome': 'True'}}},
 {'StepName': 'AbaloneEval',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 37, 34, 767000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 41, 18, 80000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'ProcessingJob': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:processing-job/pipelines-cfvy1tjuxdq8-abaloneeval-zfraozhmny'}}},
 {'StepName': 'AbaloneTrain',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 34, 55, 867000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 37, 34, 34000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'TrainingJob': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:training-job/pipelines-cfvy1tjuxdq8-abalonetrain-tavd6f3wdf'}}},
 {'StepName': 'AbaloneProcess',
  'StartTime': datetime.datetime(2020, 11, 21, 2, 30, 27, 160000, tzinfo=tzlocal()),
  'EndTime': datetime.datetime(2020, 11, 21, 2, 34, 48, 390000, tzinfo=tzlocal()),
  'StepStatus': 'Succeeded',
  'CacheHitResult': {'SourcePipelineExecutionArn': ''},
  'Metadata': {'ProcessingJob': {'Arn': 'arn:aws:sagemaker:us-east-2:111122223333:processing-job/pipelines-cfvy1tjuxdq8-abaloneprocess-mgqyfdujcj'}}}]

管道執行完成後，從 Amazon S3 下載產生的 evaluation.json 檔案以檢查報告。


evaluation_json = sagemaker.s3.S3Downloader.read_file("{}/evaluation.json".format(
    step_eval.arguments["ProcessingOutputConfig"]["Outputs"][0]["S3Output"]["S3Uri"]
))
json.loads(evaluation_json)

第 3 步：取代管道執行的預設參數

您可以透過指定不同的管道參數來覆寫預設值，來啟動管道的額外執行。

覆寫預設參數

建立管道執行。這會在模型批准狀態覆寫設為 “已批准” 的情況下啟動另一個管道執行。這意味著透過 RegisterModel 步驟產生的模型套件版本會自動準備好透過 CI/CD 管道進行部署，例如使用 SageMaker Projects。如需詳細資訊，請參閱使用 SageMaker 專案的 MLOps 自動化。
```
execution = pipeline.start(
    parameters=dict(
        ModelApprovalStatus="Approved",
    )
)
```
等候執行完成。
```
execution.wait()
```
列出執行步驟及狀態。
```
execution.list_steps()
```

管道執行完成後，從 Amazon S3 下載產生的 evaluation.json 檔案以檢查報告。


evaluation_json = sagemaker.s3.S3Downloader.read_file("{}/evaluation.json".format(
    step_eval.arguments["ProcessingOutputConfig"]["Outputs"][0]["S3Output"]["S3Uri"]
))
json.loads(evaluation_json)

第 4 步：停止並刪除管道執行

管道完成後，您可以停止任何正在進行的執行並刪除管道。

停止和刪除管道執行

停止管道執行。
```
execution.stop()
```
刪除管道。
```
pipeline.delete()
```

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

編輯管道

停止管道

下一個主題：

停止管道

上一個主題：

編輯管道

需要協助？

選取您的 Cookie 偏好設定

執行管道

注意

注意

執行管道 （管道設計工具）

注意

注意

注意

主題

先決條件

第 1 步：啟動管道

啟動管道

第 2 步：檢查管道執行

檢查管道執行

第 3 步：取代管道執行的預設參數

覆寫預設參數

第 4 步：停止並刪除管道執行

停止和刪除管道執行

執行管道 (SageMaker Python SDK)

主題

先決條件

第 1 步：啟動管道

啟動管道

第 2 步：檢查管道執行

檢查管道執行

第 3 步：取代管道執行的預設參數

覆寫預設參數

第 4 步：停止並刪除管道執行

停止和刪除管道執行

下一個主題：

上一個主題：

需要協助？

Related resources

此頁面是否有幫助？

Related resources

執行管道（管道設計工具）