將基於 Git 的存儲庫鏈接到工作室工作EMR區 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將基於 Git 的存儲庫鏈接到工作室工作EMR區

關於EMR工作室的 Git 儲存庫

您最多可以將三個 Git 儲存庫與工作EMR室工作區建立關聯。根據預設,每個工作區都可讓您從與 Studio 相同 AWS 帳戶相關聯的 Git 儲存庫清單中進行選擇。也可以建立新的 Git 儲存庫作為工作區的資源。

可以在連接到叢集的主節點時,使用終端命令執行如下的 Git 命令。

!git pull origin <branch-name>

或者,可以使用 jupyterlab-git 擴充功能。透過選擇 Git 圖示,從左側邊欄中開啟它。如需有關的副檔名的資訊,請參閱 Jupyterlab-git。 JupyterLab

必要條件

  • 若要將 Git 儲存庫與工作區建立關聯,必須將 Studio 設定為允許 Git 儲存庫連結。Studio 管理員應採取步驟以 建立 Git 儲存庫的存取權和許可

  • 如果您使用 CodeCommit 儲存庫,則必須使用 Git 認證和HTTPS. SSH不支持密鑰和HTTPS AWS Command Line Interface 憑據幫助程序。 CodeCommit 也不支持個人訪問令牌(PATs)。如需詳細資訊,請參閱使IAM用指南 CodeCommit中的使IAM用和使用 Git 認證的使用HTTPS者的安裝程式 (位於使用AWS CodeCommit 者指南)。

將關聯的 Git 儲存庫連結至工作區
  1. 從 Studio 中的工作區清單中開啟要連結至儲存庫的工作區。

  2. 在左側邊欄中,選擇 Amazon EMR Git 儲存庫圖示以開啟 Git 儲存庫工具面板。

  3. Git 儲存庫下,展開下拉式清單,並選取最多三個儲存庫以連結至工作區。EMRStudio 註冊您的選擇,並開始鏈接每個存儲庫。

完成連結程序可能需要一點時間。可以在 Git 儲存庫工具面板中查看所選取的每個儲存庫的狀態。EMRStudio 將存放庫連結至工作區之後,您應該會在「檔案」瀏覽器面板中看到屬於該儲存庫的檔案

若要將新的 Git 儲存庫作為資源新增至工作區
  1. 從 Studio 中的工作區清單中開啟要連結至儲存庫的工作區。

  2. 在左側邊欄中,選擇 Amazon EMR Git 儲存庫圖示以開啟 Git 儲存庫工具面板。

  3. 選擇新增新的 Git 儲存庫

  4. 在存放庫名稱中,輸入 EMR Studio 中儲存庫的描述性名稱。名稱僅可含有英數字元、連字號或底線。

  5. 對於 Git 儲存庫 URL,請輸入URL儲存庫的。當您使用 CodeCommit 儲存庫時,這是您選擇「複製」URL,然後選擇「複製」時所複URL製的儲存庫HTTPS。例如:https://git-codecommit.us-west-2.amazonaws.com/v1/repos/[MyCodeCommitRepoName]

  6. 針對分支,輸入要簽出的現有分支的名稱。

  7. 針對 Git 憑證,請根據下列指導方針選擇選項。EMR工作室使用存儲在秘密管理器中的密碼訪問您的 Git 憑據。

    注意

    如果您使用 GitHub 存放庫,建議您使用個人存取權杖 (PAT) 進行驗證。從 2021 年 8 月 13 日開始, GitHub 將需要基於令牌的身份驗證,並且在驗證 Git 操作時將不再接受密碼。如需詳細資訊,請參閱部 GitHub 落格文章中 Git 作業的權杖驗證要求

    選項 描述
    建立新密碼

    選擇此選項可將現有的 Git 認證與將在中 AWS Secrets Manager 為您建立的新密碼建立關聯。根據您用於儲存庫的 Git 登入資料,執行下列其中一項作業。

    如果使用 Git 使用者名稱和密碼來存取儲存庫,請選取使用者名稱和密碼,輸入要在 Secrets Manager 中使用的秘密名稱,然後輸入要與秘密建立關聯的使用者名稱密碼

    -或-

    如果您使用個人存取權杖來存取儲存庫,請選取個人存取權杖 (PAT),輸入要在 Secrets Manager 中使用的密碼名稱,然後輸入您的個人存取權杖。如需詳細資訊,請參閱為命令列建立個人存取權杖 GitHubBitbucket 的個人存取權杖。 CodeCommit 儲存庫不支援此選項。

    Use a public repository without credentials (使用不需要登入資料的公有儲存庫) 選擇此選項以存取公有儲存庫。
    使用現有的 AWS 密碼

    如果已經在 Secrets Manager 中將憑證儲存為秘密,請選擇此選項,然後從清單中選取秘密名稱。

    如果您選取與 Git 使用者名稱和密碼相關聯的密碼,密碼格式必須為 {"gitUsername": "MyUserName", "gitPassword": "MyPassword"}

  8. 選擇新增儲存庫以建立新的儲存庫。EMRStudio 創建新的存儲庫後,你會看到一個成功的消息。新儲存庫顯示在 Git 儲存庫下的下拉式清單中。

  9. 若要將新儲存庫連結至您的工作區,請從 Git 儲存庫下的下拉式清單中選擇它。

完成連結程序可能需要一點時間。EMRStudio 將新存放庫連結至工作區後,您應該會在「檔案瀏覽器」面板中看到與儲存庫相同名稱的新資料夾。

若要開啟其他連結儲存庫,請在檔案瀏覽器中導覽至其資料夾。