JupyterLab 用户指南 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

JupyterLab 用户指南

本指南向 JupyterLab 用户展示了如何在 SageMaker Studio 中运行分析和机器学习工作流程。您可以获得快速存储,并根据需要向上或向下扩展计算。

JupyterLab 支持私有空间和共享空间。私有空间的作用域仅限于域中的单个用户。共享空间允许您网域中的其他用户与您实时协作。有关 Studio 空间的信息,请参阅亚马逊 SageMaker Studio 空间

要开始使用 JupyterLab,请创建一个空间并启动您的 JupyterLab应用程序。运行 JupyterLab 应用程序的 JupyterLab 空间是一个空间。该 JupyterLab 空间使用单个 Amazon EC2 实例进行计算,使用单个 Amazon EBS 卷进行存储。您空间中的所有内容,例如您的代码、git 配置文件和环境变量,都存储在同一 Amazon EBS 卷上。该卷有 3000 个IOPS,吞吐量为每秒 125 兆字节 () MBps。您可以使用快速存储在同一个实例上打开和运行多个 Jupyter 笔记本。您也可以非常快速地在笔记本电脑中切换内核。

您的管理员已为您的空间配置了默认 Amazon EBS 存储设置。默认存储大小为 5 GB,但您可以增加获得的空间量。您可以与管理员交谈,为您提供指导。

您可以切换用于运行的 Amazon EC2 实例类型 JupyterLab,根据需要向上或向下扩展计算规模。快速启动实例的启动速度比其他实例快得多。

您的管理员可能会为您提供自定义环境的生命周期配置。您可以在创建空间时指定生命周期配置。

如果您的管理员授予您访问 Amazon 的权限EFS,则可以将您的 JupyterLab空间配置为访问它。

默认情况下, JupyterLab 应用程序使用 SageMaker 分发映像。这包括对许多机器学习、分析和深度学习软件包的支持。但是,如果您需要自定义映像,则管理员可以帮助提供对自定义映像的访问权限。

Amazon EBS 卷的持续时间与实例的生命周期无关。更改实例时不会丢失数据。使用 conda 和 pip 包管理库创建可重现的自定义环境,即使您切换实例类型,这些环境也能持续存在。

打开后 JupyterLab,您可以使用终端配置您的环境。要打开终端,请导航到启动器并选择终端

以下是您可以在中配置环境的不同方法的示例 JupyterLab。

注意

在 Studio 中,您可以使用生命周期配置来自定义您的环境,但我们建议改用包管理器。使用生命周期配置是一种更容易出错的方法。添加或删除依赖关系比调试生命周期配置脚本更容易。它还可以增加 JupyterLab 启动时间。

有关生命周期配置的信息,请参阅生命周期配置 JupyterLab