本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将基于 Git 的存储库链接到 Studio 工作区 EMR
将最多三个基于 Git 的存储库与 Amazon EMR Studio 工作区关联,以保存和共享笔记本文件。
关于 EMR Studio 的 Git 存储库
您最多可以将三个 Git 存储库与 EMR Studio 工作区相关联。默认情况下,每个工作区都允许您从与 Studio 同一个 AWS 帐户关联的 Git 存储库列表中进行选择。您还可以创建新的 Git 存储库作为 Workspace 资源。
在连接到集群的主节点时,您可以使用终端命令运行如下所示的 Git 命令。
!git pull origin
<branch-name>
或者,你可以使用 jupyterlab-git 延期。从左侧边栏中选择 Git 图标打开它。有关 jupyterlab-git 扩展的信息,请参阅 jupyterlab-git。 JupyterLab
先决条件
-
要将 Git 存储库与 Workspace 关联,Studio 必须配置为允许 Git 存储库链接。您的 Studio 管理员应该执行为基于 Git 的存储库建立访问和权限中所述的步骤。
-
如果您使用 CodeCommit 存储库,则必须使用 Git 凭据和HTTPS。 SSH不支持密钥和HTTPS AWS Command Line Interface 凭证助手。 CodeCommit 也不支持个人访问令牌 (PATs)。有关更多信息,请参阅《用户指南》 CodeCommit中的 “IAM与一起使用” 和 “IAM用户指南” 中的 “使用 Git 凭据的AWS CodeCommit 用户设置”。HTTPS
说明
将关联的 Git 存储库链接到 Workspace
-
从 Studio 的 Workspaces 列表中打开要链接到存储库的 Workspace。
-
在左侧边栏中,选择 Amazon EMR Git 存储库图标以打开 Git 存储库工具面板。
-
在 Git 存储库下,展开下拉列表,最多选择三个要链接到工作区的存储库。 EMRStudio 注册您的选择并开始关联每个存储库。
链接过程可能需要一些时间才能完成。您可以在 Git repository (Git 存储库) 工具面板中查看您选择的每个存储库的状态。EMRStudio 将存储库链接到工作区后,您应该会看到属于该存储库的文件出现在文件浏览器面板中。
将新的 Git 存储库作为资源添加到 Workspace
-
从 Studio 的 Workspaces 列表中打开要链接到存储库的 Workspace。
-
在左侧边栏中,选择 Amazon EMR Git 存储库图标以打开 Git 存储库工具面板。
-
选择 Add new Git repository (添加新的 Git 存储库)。
-
在存储库名称中,输入 EMR Studio 中存储库的描述性名称。名称只能包含字母数字字符、连字符和下划线。
-
对于 Git 存储库 URL,URL输入存储库的。使用 CodeCommit 存储库时,当您选择 “克隆”URL,URL然后选择 “克隆” 时会复制该存储库HTTPS。例如,
https://git-codecommit.us-west-2.amazonaws.com/v1/repos/[MyCodeCommitRepoName]
。 -
对于 Branch (分支),输入要签出的现有分支的名称。
-
对于 Git 凭证,请根据以下准则选择一个选项。 EMRStudio 使用存储在 Secrets Manager 中的密钥访问你的 Git 凭证。
注意
如果您使用 GitHub 存储库,我们建议您使用个人访问令牌 (PAT) 进行身份验证。从 2021 年 8 月 13 日起, GitHub 将要求基于令牌的身份验证,并且在对 Git 操作进行身份验证时将不再接受密码。有关更多信息,请参阅博客上的 Git 操作令牌身份验证要求 GitHub
文章。 选项 描述 创建新密钥 选择此选项可将现有 Git 凭据与将在中 AWS Secrets Manager 为您创建的新密钥相关联。根据您用于存储库的 Git 凭证,执行以下操作之一。
如果您使用 Git 用户名和密码访问存储库,请选择 Username and password(用户名和密码),输入要在 Secrets Manager 中使用的 Secret name(密钥名称),然后输入要与密钥关联的 Username(用户名)和 Password(密码)。
–或–
如果您使用个人访问令牌访问存储库,请选择个人访问令牌 (PAT),输入要在 Secrets Manager 中使用的密钥名称,然后输入您的个人访问令牌。有关更多信息,请参阅为 Bitbucket 的命令行创建个人访问令牌 GitHub和为
Bitbucket 创建个人访问令牌 。 CodeCommit 存储库不支持此选项。 在没有凭证的情况下使用公有存储库 选择此选项可访问公有存储库。 使用现有 AWS 密钥 如果您已将凭证保存为 Secrets Manager 中的密钥,请选择此选项,然后从列表中选择密钥名称。
如果您选择与 Git 用户名和密码关联的密钥,则密钥必须采用
{"gitUsername": "
格式。MyUserName
", "gitPassword": "MyPassword
"} -
选择 Add repository (添加存储库) 创建新存储库。EMRStudio 创建新存储库后,您将看到一条成功消息。新存储库显示在 Git repositories (Git 存储库) 下的下拉列表中。
-
要将新存储库链接到您的 Workspace,请从 Git repositories (Git 存储库) 下的下拉列表中选择它。
链接过程可能需要一些时间才能完成。EMRStudio 将新存储库链接到工作区后,您应该会在 “文件浏览器” 面板中看到一个与存储库同名的新文件夹。
要打开不同的链接存储库,请在 File browser (文件浏览器) 中导航到其文件夹。