SageMaker 筆記本工作 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

SageMaker 筆記本工作

您可以使用 Amazon 在任 SageMaker 何環境中從 Jupyter 筆記型電腦以互動方式建置、訓練和部署機器學習模型。 JupyterLab 不過,在多種情況下,您可能會想要以已排程的非互動式工作來執行筆記本。例如,您可能想要建立定期稽核報告,以分析在特定時間範圍內執行的所有訓練工作,並分析將這些模型部署到生產環境中的商業價值。或者,在對一小部分資料進行資料轉換邏輯測試之後,您可能想要擴展特徵工程工作。其他常用使用案例包括:

  • 對模型漂移監控工作進行排程

  • 探索參數空間以獲得更好的模型

在這些案例中,您可以使用「 SageMaker 筆記本工作」建立非互動式工作 (以 SageMaker 基礎訓練工作的形式執行),以便依需求或按排程執行。 SageMaker 筆記本工作提供了直觀的用戶界面,因此您可以 JupyterLab 通過選擇筆記本中的筆記本作業小部件( Blue icon of a calendar with a checkmark, representing a scheduled task or event. )來安排您的工作。您也可以使用 SageMaker Python 來排程工作SDK,這可讓您在管線工作流程中排程多個筆記本工作的彈性。您可以平行執行多個筆記本,並將筆記本中的儲存格參數化以自訂輸入參數。

此功能利用 Amazon EventBridge、 SageMaker 訓練和 SageMaker 管道服務,並可在下列任何環境中的 Jupyter 筆記本中使用:

  • 工作室、工作室實驗室、工作室經典版或筆記型電腦

  • 本機設定,例如您的本機電腦,您執行的位置 JupyterLab

必要條件

若要對筆記本工作進行排程,請確定符合下列條件:

  • 確保您的 Jupyter 筆記本和任何初始化或啟動指令碼在代碼和軟體套件方面都是獨立的。否則,您的非互動式工作可能會產生錯誤。

  • 檢閱 限制和考量事項 以確保您已正確設定 Jupyter 筆記本、網路設定和容器設定。

  • 確保您的筆記型電腦可以存取所需的外部資源,例如 Amazon EMR 叢集。

  • 如果您要在本機 Jupyter 筆記本中設定筆記本工作,請完成安裝。如需說明,請參閱 安裝指南

  • 如果您連接到筆記本中的 Amazon EMR 叢集,並想要參數化 Amazon EMR 連線命令,則必須使用環境變數套用因應措施來傳遞參數。如需詳細資訊,請參閱 從筆記型電腦 Connect 到 Amazon EMR 叢集

  • 如果您使用 Kerberos 或HTTP基本驗證身份驗證連接到 Amazon EMR 叢集,則必須使用將安全登入資料傳遞 AWS Secrets Manager 至 Amazon EMR 連線命令。LDAP如需詳細資訊,請參閱 從筆記型電腦 Connect 到 Amazon EMR 叢集

  • (選擇性) 如果您希望 UI 預先載入在筆記型電腦啟動時執行的指令碼,您的管理員必須使用生命週期組態 (LCC) 來安裝指令碼。如需如何使用LCC指令碼的詳細資訊,請參閱使用生命週期組態指令碼自訂筆記本執行個體。