將 Git 型儲存庫連結至 EMR Studio 工作區 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將 Git 型儲存庫連結至 EMR Studio 工作區

將最多三個 Git 型儲存庫與 Amazon EMR Studio 工作區建立關聯,以儲存和共用筆記本檔案。

關於 EMR Studio 的 Git 儲存庫

您最多可以將三個 Git 儲存庫與 EMR Studio 工作區建立關聯。根據預設,每個工作區都可讓您從與 Studio 相同 AWS 帳戶相關聯的 Git 儲存庫清單中選擇。也可以建立新的 Git 儲存庫作為工作區的資源。

可以在連接到叢集的主節點時,使用終端命令執行如下的 Git 命令。

!git pull origin <branch-name>

或者,您可以使用 jupyterlab-git 延伸模組。透過選擇 Git 圖示,從左側邊欄中開啟它。如需 jupyterlab-git 延伸模組的相關資訊 JupyterLab,請參閱 jupyterlab-git

必要條件

  • 若要將 Git 儲存庫與工作區建立關聯,必須將 Studio 設定為允許 Git 儲存庫連結。Studio 管理員應採取步驟以 建立 Git 儲存庫的存取權和許可

  • 如果您使用 CodeCommit 儲存庫,則必須使用 Git 登入資料和 HTTPS。不支援 SSH金鑰和 HTTPS 搭配 AWS Command Line Interface 登入資料協助程式。 CodeCommit 也不支援個人存取字符 (PATs)。如需詳細資訊,請參閱《 IAM 使用者指南》中的使用 IAM 搭配 CodeCommit ,以及》 AWS CodeCommit 使用者指南》中的使用 Git 登入資料HTTPS的使用者設定

將關聯的 Git 儲存庫連結至工作區
  1. 從 Studio 中的工作區清單中開啟要連結至儲存庫的工作區。

  2. 在左側側邊欄中,選擇 Amazon EMR Git 儲存庫圖示以開啟 Git 儲存庫工具面板。

  3. Git 儲存庫下,展開下拉式清單,並選取最多三個要連結至工作區的儲存庫。 EMRStudio 會註冊您的選擇,並開始連結每個儲存庫。

完成連結程序可能需要一點時間。可以在 Git 儲存庫工具面板中查看所選取的每個儲存庫的狀態。EMR Studio 將儲存庫連結至工作區後,您應該會在檔案瀏覽器面板中看到屬於該儲存庫的檔案

若要將新的 Git 儲存庫作為資源新增至工作區
  1. 從 Studio 中的工作區清單中開啟要連結至儲存庫的工作區。

  2. 在左側側邊欄中,選擇 Amazon EMR Git 儲存庫圖示以開啟 Git 儲存庫工具面板。

  3. 選擇新增新的 Git 儲存庫

  4. 儲存庫名稱中,輸入 EMR Studio 中儲存庫的描述性名稱。名稱僅可含有英數字元、連字號或底線。

  5. 對於 Git 儲存庫 URL,輸入儲存庫URL的 。當您使用 CodeCommit 儲存庫時,這是您選擇複製URL,然後選擇複製 時URL複製的 HTTPS。例如:https://git-codecommit.us-west-2.amazonaws.com/v1/repos/[MyCodeCommitRepoName]

  6. 針對分支,輸入要簽出的現有分支的名稱。

  7. 對於 Git 登入資料,請根據下列準則選擇一個選項。 EMRStudio 會使用存放在 Secrets Manager 中的秘密存取您的 Git 登入資料。

    注意

    如果您使用 GitHub 儲存庫,我們建議您使用個人存取字符 (PAT) 進行身分驗證。自 2021 年 8 月 13 日起, GitHub 將需要以字符為基礎的身分驗證,且在驗證 Git 操作時將不再接受密碼。如需詳細資訊,請參閱 GitHub 部落格中的 Git 操作文章的權杖身分驗證要求

    選項 描述
    建立新密碼

    選擇此選項,將現有的 Git 登入資料與將在 中 AWS Secrets Manager 為您建立的新秘密建立關聯。根據您用於儲存庫的 Git 登入資料,執行下列其中一項作業。

    如果使用 Git 使用者名稱和密碼來存取儲存庫,請選取使用者名稱和密碼,輸入要在 Secrets Manager 中使用的秘密名稱,然後輸入要與秘密建立關聯的使用者名稱密碼

    -或-

    如果您使用個人存取字符來存取儲存庫,請選取個人存取字符 (PAT),輸入要在 Secrets Manager 中使用的秘密名稱,然後輸入您的個人存取字符。如需詳細資訊,請參閱為 的命令列建立個人存取字符 GitHub,以及為 Bitbucket.repositories 建立個人存取字符不支援此選項。 CodeCommit

    Use a public repository without credentials (使用不需要登入資料的公有儲存庫) 選擇此選項以存取公有儲存庫。
    使用現有的 AWS 秘密

    如果已經在 Secrets Manager 中將憑證儲存為秘密,請選擇此選項,然後從清單中選取秘密名稱。

    如果您選取與 Git 使用者名稱和密碼相關聯的密碼,密碼格式必須為 {"gitUsername": "MyUserName", "gitPassword": "MyPassword"}

  8. 選擇新增儲存庫以建立新的儲存庫。EMR Studio 建立新儲存庫後,您會看到成功訊息。新儲存庫顯示在 Git 儲存庫下的下拉式清單中。

  9. 若要將新儲存庫連結至您的工作區,請從 Git 儲存庫下的下拉式清單中選擇它。

完成連結程序可能需要一點時間。EMR Studio 將新儲存庫連結至工作區後,您應該會在檔案瀏覽器面板中看到與儲存庫名稱相同的新資料夾。

若要開啟其他連結儲存庫,請在檔案瀏覽器中導覽至其資料夾。