本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
SageMaker 筆記本任務
您可以使用 Amazon 在任何 JupyterLab 環境中從 Jupyter 筆記本以 SageMaker 互動方式建置、訓練和部署機器學習模型。不過,在多種情況下,您可能會想要以已排程的非互動式工作來執行筆記本。例如,您可能想要建立定期稽核報告,以分析在特定時間範圍內執行的所有訓練工作,並分析將這些模型部署到生產環境中的商業價值。或者,在對一小部分資料進行資料轉換邏輯測試之後,您可能想要擴展特徵工程工作。其他常用使用案例包括:
-
對模型漂移監控工作進行排程
-
探索參數空間以獲得更好的模型
在這些情況下,您可以使用 SageMaker 筆記本任務建立非互動式任務 (作為基礎訓練任務 SageMaker 執行),以隨需執行或按排程執行。 SageMaker 筆記本任務提供直覺式使用者介面,因此您可以在筆記本中選擇筆記本任務小工具 ( ) JupyterLab ,從中排程任務。您也可以使用 SageMaker Python 來排程任務SDK,此 Python 提供在管道工作流程中排程多個筆記本任務的彈性。您可以平行執行多個筆記本,並將筆記本中的儲存格參數化以自訂輸入參數。
此功能會利用 Amazon EventBridge、 SageMaker 訓練和管道服務,並可在下列任何環境中用於 Jupyter 筆記本:
-
Studio、Studio Lab、Studio Classic 或 Notebook 執行個體
-
本機設定,例如您執行的本機機器 JupyterLab
必要條件
若要對筆記本工作進行排程,請確定符合下列條件:
-
確保您的 Jupyter 筆記本和任何初始化或啟動指令碼在代碼和軟體套件方面都是獨立的。否則,您的非互動式工作可能會產生錯誤。
-
檢閱 限制和考量事項 以確保您已正確設定 Jupyter 筆記本、網路設定和容器設定。
-
確保您的筆記本可以存取所需的外部資源,例如 Amazon EMR叢集。
-
如果您要在本機 Jupyter 筆記本中設定筆記本工作,請完成安裝。如需說明,請參閱 安裝指南。
-
如果您連線到筆記本中的 Amazon EMR叢集,並想要參數化 Amazon EMR連線命令,則必須使用環境變數套用因應措施來傳遞參數。如需詳細資訊,請參閱 從筆記本連線至 Amazon EMR叢集。
-
如果您使用 Kerberos、 LDAP或HTTP基本身分驗證身分驗證連線至 Amazon EMR叢集,則必須使用 AWS Secrets Manager 將安全憑證傳遞至 Amazon EMR連線命令。如需詳細資訊,請參閱 從筆記本連線至 Amazon EMR叢集。
-
(選用) 如果您希望 UI 在筆記本啟動時預先載入指令碼,管理員必須使用生命週期組態 () 安裝指令碼LCC。如需有關如何使用LCC指令碼的資訊,請參閱使用生命週期組態指令碼自訂筆記本執行個體。