Git 기반 리포지토리에 대한 액세스 및 권한 설정 - 아마존 EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Git 기반 리포지토리에 대한 액세스 및 권한 설정

EMRStudio는 다음과 같은 Git 기반 서비스를 지원합니다.

EMRStudio 사용자가 Git 리포지토리를 Workspace와 연결할 수 있게 하려면 다음과 같은 액세스 및 권한 요구 사항을 설정하십시오. Studio용으로 비공개로 호스팅되는 Git 리포지토리 구성 EMR의 지침에 따라 프라이빗 네트워크에서 호스팅하는 Git 기반 리포지토리를 구성할 수도 있습니다.

클러스터 인터넷 액세스

Amazon EMR EC2 및 Studio EMR Workspaces에 연결된 EKS 클러스터에서 실행되는 Amazon 클러스터는 모두 네트워크 주소 변환 (NAT) 게이트웨이를 사용하는 프라이빗 서브넷에 있거나 가상 프라이빗 게이트웨이를 통해 인터넷에 액세스할 수 있어야 합니다. 자세한 내용은 아마존 VPC 옵션 단원을 참조하십시오.

EMRStudio와 함께 사용하는 보안 그룹에는 Workspaces가 연결된 클러스터에서 인터넷으로 트래픽을 라우팅할 수 있도록 허용하는 아웃바운드 규칙도 포함되어야 합니다. EMR 자세한 내용은 EMRStudio 네트워크 트래픽을 제어할 보안 그룹을 정의합니다. 단원을 참조하십시오.

중요

네트워크 인터페이스가 퍼블릭 서브넷에 있는 경우 인터넷 게이트웨이 () 를 통해 인터넷과 통신할 수 없습니다. IGW

에 대한 권한 AWS Secrets Manager

EMRStudio 사용자가 암호가 저장된 Git 리포지토리에 액세스할 수 있게 하려면 작업을 허용하는 EMRStudio의 서비스 역할에 권한 정책을 추가하십시오. AWS Secrets Managersecretsmanager:GetSecretValue

Git 기반 리포지토리를 Workspaces에 연결하는 방법에 대한 자세한 내용은 Git 기반 리포지토리를 스튜디오 워크스페이스에 연결 EMR 섹션을 참조하세요.

Studio용으로 비공개로 호스팅되는 Git 리포지토리 구성 EMR

Amazon Studio용 프라이빗 호스팅 리포지토리를 구성하려면 다음 지침을 사용하십시오. EMR 사용자 DNS 및 Git 서버에 대한 정보가 포함된 구성 파일을 제공하십시오. EMRStudio는 이 정보를 사용하여 자체 관리형 리포지토리로 트래픽을 라우팅할 수 있는 작업 영역을 구성합니다.

참고

DnsServerIpV4구성하면 EMR Studio는 DNS 서버를 사용하여 사용자와 Amazon EMR 엔드포인트를 모두 해결합니다 GitServerDnsName (예:)elasticmapreduce.us-east-1.amazonaws.com. EMRAmazon용 엔드포인트를 설정하려면 스튜디오에서 VPC 사용하는 엔드포인트를 통해 엔드포인트에 연결합니다. 이렇게 하면 Amazon EMR 엔드포인트가 사설 IP로 확인됩니다. 자세한 내용은 인터페이스 VPC 엔드포인트를 EMR 사용하여 Amazon에 연결 단원을 참조하십시오.

사전 조건

EMRStudio용으로 비공개로 호스팅되는 Git 리포지토리를 구성하려면 먼저 Studio가 스튜디오의 작업 공간 및 노트북 파일을 백업할 수 EMR 있는 Amazon S3 스토리지 위치가 필요합니다. Studio를 생성할 때 지정한 것과 동일한 S3 버킷을 사용합니다.

비공개로 호스팅되는 Git 리포지토리를 Studio용으로 하나 이상 구성하려면 EMR
  1. 다음 템플릿을 사용하여 구성 파일을 생성합니다. 구성에서 지정하려는 각 Git 서버에 대해 다음 값을 포함합니다.

    • DnsServerIpV4- 서버 IPv4 주소. DNS DnsServerIpV4과 모두에 값을 입력하면 의 값이 GitServerIpV4List DnsServerIpV4 우선하며 EMR Studio는 이 값을 DnsServerIpV4 사용하여 문제를 해결합니다GitServerDnsName.

      참고

      비공개로 호스팅되는 Git 리포지토리를 사용하려면 서버에서 Studio의 DNS 인바운드 액세스를 허용해야 합니다. EMR 다른 무단 액세스로부터 DNS 서버를 보호하는 것이 좋습니다.

    • GitServerDnsName- Git 서버의 DNS 이름 예: "git.example.com".

    • GitServerIpV4List- Git 서버에 속하는 IPv4 주소 목록.

    [ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ]
  2. 구성 파일을 configuration.json으로 저장합니다.

  3. 구성 파일을 Amazon S3 스토리지 위치, life-cycle-configuration 폴더에 업로드합니다. 예를 들어, 기본 S3 위치가 s3://DOC-EXAMPLE-BUCKET/studios인 경우 구성 파일은 s3://DOC-EXAMPLE-BUCKET/studios/life-cycle-configuration/configuration.json에 있습니다.

    중요

    life-cycle-configuration폴더에 대한 액세스를 Studio 관리자와 EMR Studio 서비스 역할로 제한하고 무단 configuration.json 액세스로부터 보안을 유지하는 것이 좋습니다. 관련 지침은 사용자 정책을 사용하여 버킷에 대한 액세스 제어 또는 Amazon S3의 보안 모범 사례를 참조하세요.

    업로드 지침은 Amazon Simple Storage Service 사용 설명서에서 폴더 생성객체 업로드를 참조하세요. 구성을 기존 Workspace에 적용하려면 구성 파일을 Amazon S3에 업로드한 후 Workspace를 닫고 다시 시작합니다.