在 Amazon SageMaker Studio Lab 中使用外部资源 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon SageMaker Studio Lab 中使用外部资源

通过 Amazon SageMaker Studio Lab,您可以集成来自 Git 存储库和 Amazon S3 的外部资源,例如 Jupyter 笔记本和数据。您还可以在 GitHub 存储库和笔记本中添加在 Studio Lab 中打开按钮。通过此按钮,您可以直接从 Studio Lab 克隆笔记本。

以下主题将介绍如何集成外部资源。

使用 GitHub 资源

Studio Lab 提供与 GitHub 的集成。通过这种集成,您可以将笔记本和存储库直接克隆到 Studio Lab 项目中。

以下主题介绍了如何在 Studio Lab 中使用 GitHub 资源。

Studio Lab 示例笔记本

要开始使用为 Studio Lab 量身定制的示例笔记本存储库,请参阅 Studio Lab 示例笔记本

此存储库为以下使用案例和其他使用案例提供笔记本。

  • 计算机视觉

  • 连接到 AWS

  • 创建自定义环境

  • 地理空间数据分析

  • 自然语言处理

  • 使用 R

克隆 GitHub 存储库

要将 GitHub 存储库克隆到 Studio Lab 项目,请按照以下步骤操作。

  1. 启动 Studio Lab 项目运行时系统。有关启动 Studio Lab 项目运行时系统的更多信息,请参阅启动项目运行时系统

  2. 在 Studio Lab 中,选择左侧菜单上的文件浏览器图标 ( Black square icon representing a placeholder or empty image. ),这样文件浏览器面板就会显示在左侧。

  3. 选择文件搜索栏下方的文件图标,导航至用户目录。

  4. 从左侧菜单中选择 Git 图标 ( Black square icon representing a placeholder or empty image. ),打开一个新的下拉菜单。

  5. 选择克隆存储库

  6. 将存储库的 URL 粘贴到 Git 存储库 URL (.git) 下。

  7. 选择克隆

从 GitHub 克隆单个笔记本

要在 Studio Lab 中打开笔记本,您必须有权访问该笔记本所在的存储库。以下示例描述了 Studio Lab 在各种情况下与权限相关的行为。

  • 如果存储库是公有的,您可以从 Studio Lab 预览页面自动将笔记本克隆到项目中。

  • 如果存储库是私有的,系统会提示您从 Studio Lab 预览页面登录 GitHub。如果您有权访问私有存储库,则可以将笔记本克隆到项目中。

  • 如果您无权访问私有存储库,则无法从 Studio Lab 预览页面克隆笔记本。

以下各节将介绍用于在 Studio Lab 项目中复制 GitHub 笔记本的两个选项。这些选项取决于笔记本是否有在 Studio Lab 中打开按钮。

选项 1:用在 Studio Lab 中打开按钮复制笔记本

以下过程介绍如何复制具有在 Studio Lab 中打开按钮的笔记本。如果您想将此按钮添加到笔记本中,请参阅在笔记本中添加在 Studio Lab 中打开按钮

  1. 按照登录 Studio Lab中的步骤登录 Studio Lab。

  2. 在新的浏览器标签页中,导航到要克隆的 GitHub 笔记本。

  3. 在笔记本中,选择在 Studio Lab 中打开按钮,即可在 Studio Lab 中打开一个新页面,并预览笔记本。

  4. 如果项目运行时系统尚未运行,请选择预览页面顶部的启动运行时系统按钮来启动运行时系统。等待运行时系统启动后再进行下一步。

  5. 项目运行时系统启动后,选择复制到项目,即可在新的浏览器标签页中打开项目运行时系统。

  6. 从 GitHub 复制?对话框中,选择仅复制笔记本。这会将笔记本文件复制到项目中。

选项 2:克隆任何 GitHub 笔记本

以下过程介绍如何从 GitHub 复制任何笔记本。

  1. 导航至 GitHub 中的笔记本。

  2. 在浏览器地址栏中,修改笔记本 URL,如下所示。

    # Original URL https://github.com/<PATH_TO_NOTEBOOK> # Modified URL  https://studiolab.sagemaker.aws/import/github/<PATH_TO_NOTEBOOK>
  3. 导航至修改后的 URL。这将在 Studio Lab 中打开笔记本的预览。

  4. 如果项目运行时系统尚未运行,请选择预览页面顶部的启动运行时系统按钮来启动运行时系统。等待运行时系统启动后再进行下一步。

  5. 项目运行时系统启动后,选择复制到项目,即可在新的浏览器标签页中打开项目运行时系统。

  6. 从 GitHub 复制?对话框中,选择仅复制笔记本将笔记本文件复制到项目中。

在笔记本中添加在 Studio Lab 中打开按钮

在 Studio Lab 中打开按钮添加到笔记本后,其他人就可以将您的笔记本或存储库直接克隆到他们的 Studio Lab 项目中。如果您在 GitHub 公有存储库中共享笔记本,则您的内容将是公开可读的。请勿在笔记本中共享私有内容,如 AWS 访问密钥或 AWS Identity and Access Management 凭证。

要将在 Studio Lab 中打开功能按钮添加到您的 Jupyter 笔记本或存储库,请在笔记本或存储库顶部添加以下标记。

[![Open In SageMaker Studio Lab](https://studiolab.sagemaker.aws/studiolab.svg)](https://studiolab.sagemaker.aws/import/github/<PATH_TO_YOUR_NOTEBOOK_ON_GITHUB>)

从电脑中导入文件

以下步骤说明如何将电脑中的文件导入到 Studio Lab 项目。 

  1. 打开 Studio Lab 项目运行时系统。

  2. 打开文件浏览器面板。

  3. 文件浏览器面板的操作栏中,选择上传文件按钮。

  4. 选择要从本地电脑上传的文件。

  5. 选择打开

或者,您可以将文件从电脑拖放到文件浏览器面板。

连接到 Amazon S3

AWS CLI 可在 Studio Lab 项目中实现 AWS 集成。通过这种集成,您可以从 Amazon S3 中提取资源以与 Jupyter 笔记本一起使用。

要在 Studio Lab 中使用 AWS CLI,请完成以下步骤。有关概述这种集成的笔记本,请参阅结合使用 Studio Lab 与 AWS 资源

  1. 按照安装或更新 AWS CLI 的最新版本中的步骤安装 AWS CLI。

  2. 按照快速设置中的步骤配置您的 AWS 凭证。您 AWS 账户的角色必须有权访问您要从中复制数据的 Amazon S3 存储桶。

  3. 在 Jupyter 笔记本中,根据需要从 Amazon S3 存储桶克隆资源。以下命令显示了如何将 Amazon S3 路径中的所有资源克隆到项目中。有关更多信息,请参阅 AWS CLI 命令参考

    !aws s3 cp s3://<BUCKET_NAME>/<PATH_TO_RESOURCES>/ <PROJECT_DESTINATION_PATH>/ --recursive