建立 Git 儲存庫的存取權和許可 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立 Git 儲存庫的存取權和許可

EMR工作室支持以下基於 Git 的服務:

若要讓 EMR Studio 使用者將 Git 儲存庫與工作區建立關聯,請設定下列存取和權限需求。也可以依照 為EMR工作室配置一個私人託管的 Git 存儲庫 中的指示,設定在私有網路中託管的 Git 儲存庫。

叢集網際網路存取

在 Amazon EC2 和 Amazon EMR 上連接至 Studio Workspace 的EKS叢集EMR上執行的 Amazon 叢集都必須位於使用網路地址轉譯 (NAT) 閘道的私有子網路中,否則必須能夠透過虛擬私有閘道存取網際網路。如需詳細資訊,請參閱Amazon VPC 選項

與 EMR Studio 搭配使用的安全性群組還必須包含輸出規則,允許 Workspace 將流量從連接的EMR叢集路由到網際網路。如需詳細資訊,請參閱定義安全群組以控制 EMR Studio 網路流量

重要

如果網路介面位於公有子網路中,則無法透過網際網路閘道 (IGW) 與網際網路通訊。

的權限 AWS Secrets Manager

若要讓 EMR Studio 使用者存取含有密碼的 Git 儲存庫 AWS Secrets Manager,請將權限原則新增至允許secretsmanager:GetSecretValue作業的 EMR Studio 服務角色

如需有關如何將 Git 儲存庫連結至工作區的相關資訊,請參閱 將基於 Git 的存儲庫鏈接到工作室工作EMR區

為EMR工作室配置一個私人託管的 Git 存儲庫

使用下列指示為 Amazon EMR Studio 設定私有託管的儲存庫。提供一個配置文件,其中包含有關您DNS和 Git 服務器的信息。EMRStudio 會使用此資訊來設定可將流量路由到您自我管理儲存庫的工作區。

注意

如果您進行配置DnsServerIpV4,EMRStudio 會使用您的DNS服務器來解決您GitServerDnsName和您的 Amazon EMR 端點,例如elasticmapreduce.us-east-1.amazonaws.com. 要為 Amazon 設置端點EMR,請通過與 Studio 一起使用的端點連接到端點。VPC如此可確保 Amazon EMR 端點解析為私有 IP。如需詳細資訊,請參閱EMR使用界面VPC端點 Connect 到 Amazon

先決條件

在為 EMR Studio 設定私有託管的 Git 儲存庫之前,您需要一個 Amazon S3 儲存位置,讓 EMR Studio 可以在 Studio 中備份工作區和筆記本檔案。使用您在建立 Studio 時指定的相同 S3 儲存貯體。

若要為 EMR Studio 設定一個或多個私有代管的 Git 儲存庫
  1. 使用下列範本建立組態檔案。針對您要在組態中指定的每個 Git 伺服器,包括下列值:

    • DnsServerIpV4-您的DNS服務器的IPv4地址。如果您為DnsServerIpV4和提供值GitServerIpV4List,則的值優DnsServerIpV4先於,而 EMR Studio 使用DnsServerIpV4來解析您的GitServerDnsName.

      注意

      要使用私有託管的 Git 存儲庫,您的DNS服務器必須允許來自 EMR Studio 的入站訪問。我們敦促您保護您的DNS服務器免受其他未經授權的訪問。

    • GitServerDnsName-Git 伺服器的DNS名稱。例如 "git.example.com"

    • GitServerIpV4List-屬於您 Git 伺服器的IPv4位址清單。

    [ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ]
  2. 將組態檔案另存為 configuration.json

  3. 將組態檔案上傳到名為 life-cycle-configuration 的資料夾中的 Amazon S3 儲存位置。例如,如果預設的 S3 位置為 s3://DOC-EXAMPLE-BUCKET/studios,則組態檔案應位於 s3://DOC-EXAMPLE-BUCKET/studios/life-cycle-configuration/configuration.json

    重要

    我們敦促您限制 Studio 管理員和您的 EMR Studio 服務角色對life-cycle-configuration資料夾的存取權限,並確保configuration.json防止未經授權的存取。如需指示,請參閱透過使用者政策來控制對儲存貯體的存取Amazon S3 的安全最佳實務

    如需上傳說明,請參閱《Amazon Simple Storage Service 使用者指南》中的建立資料夾上傳物件。若要將組態套用到現有工作區,請在將組態檔案上傳到 Amazon S3 後關閉並重新啟動工作區。