SageMaker 笔记本职位 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

SageMaker 笔记本职位

您可以使用 Amazon SageMaker 在任何环境中通过 Jupyter 笔记本以交互方式构建、训练和部署机器学习模型。 JupyterLab 但是,在许多场景中,您可能希望将笔记本作为非交互式计划作业运行。例如,您可能想要创建定期审计报告,以分析在特定时间范围内运行的所有训练作业,并分析将这些模型部署到生产环境中所带来的业务价值。或者,在对一小部分数据子集进行数据转换逻辑测试后,您可能想扩展特征工程作业。其他常见使用案例包括:

  • 计划作业以进行模型偏差监控

  • 探索参数空间以获得更好的模型

在这些场景中,您可以使用 SageMaker Notebook Job SageMaker s 创建非交互式作业(作为基础训练作业运行),该作业可以按需运行,也可以按计划运行。 SageMaker Notebook Jobs 提供了直观的用户界面,因此您可以 JupyterLab 通过选择笔记本中的 “笔记本作业” 控件 ( Blue icon of a calendar with a checkmark, representing a scheduled task or event. ) 直接安排作业。您还可以使用 SageMaker Python 来安排作业SDK,它可以灵活地在管道工作流程中安排多个笔记本作业。您可以并行运行多个笔记本,并对笔记本中的单元格进行参数化以自定义输入参数。

此功能利用了 Amazon EventBridge、Tra SageMaker ining 和 Pipelines 服务,可在以下任何环境下的 Jupyter 笔记本中使用:

  • Studio、Studio 实验室、Studio 经典版或笔记本

  • 本地设置,例如您运行的本地计算机 JupyterLab

先决条件

要计划笔记本作业,请确保满足以下条件:

  • 确保您的 Jupyter 笔记本以及所有初始化或启动脚本在代码和软件包方面都是独立的。否则,您的非交互式作业可能会出现错误。

  • 查看约束和注意事项以确保正确配置了 Jupyter 笔记本、网络设置和容器设置。

  • 确保您的笔记本可以访问所需的外部资源,例如 Amazon EMR 集群。

  • 如果您正在本地 Jupyter 笔记本中设置笔记本作业,请完成安装。有关说明,请参阅 安装指南

  • 如果您在笔记本中连接到 Amazon EMR 集群并想对您的 Amazon EMR 连接命令进行参数化,则必须使用环境变量来应用变通方法来传递参数。有关详细信息,请参阅从您的笔记本电脑连接到 Amazon EMR 集群

  • 如果您使用 Kerberos LDAP、或HTTP基本身份验证身份验证连接到 Amazon EMR 集群,则必须使用将您的安全证书传递 AWS Secrets Manager 给您的 Ama EMR zon 连接命令。有关详细信息,请参阅从您的笔记本电脑连接到 Amazon EMR 集群

  • (可选)如果您希望用户界面预加载脚本以在笔记本启动时运行,则管理员必须使用生命周期配置(LCC)进行安装。有关如何使用脚本的信息,请参阅使用生命周期配置LCC脚本自定义 Notebook 实例