本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
透過 Amazon SageMaker AI,您可以在建立資料集、執行資料轉換、從資料建置模型,以及將模型部署到端點以進行推論時,管理整個 ML 工作流程。如果您定期執行工作流程的任何步驟子集,您也可以選擇按照排程執行這些步驟。例如,您可能想要在 SageMaker Canvas 中排程任務,以每小時對新資料執行轉換。在另一個案例中,您可能想要排定每週任務,以監控已部署模型的模型偏離。您可以指定任何時間間隔的週期性排程:您可以在每月的每秒、每分鐘、每日、每週、每月或第三個星期五下午 3 點進行反覆運算。
以下案例總結了根據您的使用案例您可以使用的選項。
使用案例 1:在無程式碼環境中建置和排程您的 ML 工作流程。對於新手或 SageMaker AI 新手,您可以使用 Amazon SageMaker Canvas 來建置 ML 工作流程,並使用 Canvas UI 型排程器建立排程執行。
使用案例 2:在單一 Jupyter 筆記本中建置工作流程,並使用無程式碼排程器。經驗豐富的 ML 從業人員可以使用程式碼在 Jupyter 筆記本中建置其 ML 工作流程,並使用筆記本任務小工具提供的無程式碼排程選項。如果您的 ML 工作流程包含多個 Jupyter 筆記本,您可以使用使用案例 3 中所述管道 Python SDK 中的排程功能。
使用案例 3:使用管道建置和排程您的 ML 工作流程。進階使用者可以使用管道提供的 Amazon SageMaker Python SDK
或 Amazon EventBridge 排程選項。您可以建置 ML 工作流程,其中包含步驟,其中包含各種 SageMaker AI 功能 AWS 和服務的操作,例如 Amazon EMR。
描述項 | 使用案例 1 | 使用案例 2 | 使用案例 3 |
---|---|---|---|
SageMaker AI 功能 | Amazon SageMaker Canvas 資料處理和 ML 工作流程排程 | 筆記本任務排程小工具 (UI) | 管道 Python SDK 排程選項 |
描述 | 使用 Amazon SageMaker Canvas,您可以排程自動執行資料處理步驟,並在個別程序中自動更新資料集。您也可以設定組態,在更新特定資料集時執行批次預測,間接排程整個 ML 工作流程。對於自動資料處理和資料集更新,SageMaker Canvas 提供基本表單,您可以在其中選取開始時間和執行之間的時間間隔 (如果您排程資料處理步驟,則為 Cron 表達式)。如需如何排程資料處理步驟的詳細資訊,請參閱建立排程以自動處理新資料。如需如何排程資料集和批次預測更新的詳細資訊,請參閱如何管理自動化。 | 如果您在單一 Jupyter 筆記本中建置了資料處理和管道工作流程,您可以使用筆記本任務小工具來隨需或依排程執行筆記本。筆記本任務小工具會顯示基本表單,您可以在其中指定運算類型、執行排程和選用的自訂設定。您可以透過選取以時間為基礎的間隔或插入 Cron 表達式來定義執行排程。小工具會自動安裝在 Studio 中,或者您可以執行其他安裝,以在本機 JupyterLab 環境中使用此功能。如需筆記本任務的詳細資訊,請參閱 SageMaker 筆記本工作。 | 如果您使用管道實作 ML 工作流程,則可以使用 SageMaker AI SDK 中的排程功能。您的管道可以包含微調、資料處理和部署等步驟。管道支援兩種排程管道的方式。您可以建立 Amazon EventBridge 規則,或使用 SageMaker AI SDK PipelineSchedule |
針對 最佳化 | 提供 SageMaker Canvas ML 工作流程的排程選項 | 為 Jupyter 筆記本型 ML 工作流程提供 UI 型排程選項 | 提供適用於 ML 工作流程的 SageMaker AI SDK 或 EventBridge 排程選項 |
考量事項 | 您可以使用 Canvas 無程式碼架構來排程工作流程,但資料集更新和批次轉換更新最多可處理 5GB 的資料。 | 您可以在相同的任務中使用 UI 型排程表單來排程一個筆記本,但不能使用多個筆記本。若要排程多個筆記本,請使用使用案例 3 中所述的管道 SDK 程式碼型解決方案。 | 您可以使用管道提供的更進階 (以 SDK 為基礎的) 排程功能,但您需要參考 API 文件來指定正確的選項,而不是從以 UI 為基礎的選項功能表中進行選擇。 |
建議的環境 | Amazon SageMaker Canvas | Studio、本機 JupyterLab 環境 | Studio、本機 JupyterLab 環境、任何程式碼編輯器 |
其他資源
SageMaker AI 提供下列其他選項來排程您的工作流程。
什麼是 Amazon EventBridge 排程器?。本節討論的排程選項包括 SageMaker Canvas、Studio 和 SageMaker AI Python SDK 中可用的預先建置選項。所有選項都擴展了 Amazon EventBridge 的功能,您也可以使用 EventBridge 建立自己的自訂排程解決方案。
以排程和事件為基礎執行特徵處理器管道。 使用 Amazon SageMaker Feature Store Feature Processing,您可以將特徵處理管道設定為排程執行,或由於另一個 AWS 服務事件而執行。