Amazon EMR에 대해 VPC에서 네트워킹 구성 - Amazon EMR

Amazon EMR에 대해 VPC에서 네트워킹 구성

대부분의 클러스터는 Amazon Virtual Private Cloud(VPC)를 사용해 가상 네트워크로 시작됩니다. VPC는 AWS 계정 내에서 논리적으로 격리된 AWS의 격리된 가상 네트워크입니다. 프라이빗 IP 주소 범위, 서브넷, 라우팅 테이블, 네트워크 게이트웨이 등의 요소를 구성할 수 있습니다. 자세한 내용은 Amazon VPC 사용 설명서를 참조하세요.

VPC는 다음과 같은 기능을 제공합니다.

  • 중요 데이터 처리

    클러스터를 VPC에서 시작하는 것은 네트워크에 대한 액세스 권한이 있는 사람을 정의하기 위해 라우팅 테이블 및 네트워크 ACL 같은 추가 도구를 사용하여 클러스터를 프라이빗 네트워크에서 시작하는 것과 비슷합니다. 클러스터에서 중요 데이터를 처리하려는 경우 VPC에서 클러스터 시작 시 얻게 되는 추가 액세스 제어 기능이 필요할 수도 있습니다. 뿐만 아니라, 모든 리소스가 직접 인터넷에 연결할 수 없는 프라이빗 서브넷에서 리소스를 시작하도록 선택할 수도 있습니다.

  • 내부 네트워크의 리소스에 액세스

    데이터 소스가 프라이빗 네트워크에 있는 경우 데이터의 중요 특성이나 전송할 데이터의 양 때문에 Amazon EMR로 가져오기 위해 해당 데이터를 AWS로 업로드하는 것이 불가능하거나 바람직하지 않을 수도 있습니다. 대신에, 클러스터를 VPC에서 시작하고 VPN 연결을 통해 데이터 센터를 VPC에 연결하면 클러스터에서 내부 네트워크의 리소스에 액세스할 수 있습니다. 예를 들어 데이터 센터에 Oracle 데이터베이스가 있는 경우 VPN에 의해 해당 네트워크에 연결된 VPC에서 클러스터를 시작하면 클러스터에서 Oracle 데이터베이스에 액세스할 수 있습니다.

퍼블릭 및 프라이빗 서브넷

퍼블릭 및 프라이빗 VPC 서브넷 모두에서 Amazon EMR 클러스터를 시작할 수 있습니다. 즉, Amazon EMR 클러스터를 실행하는 데 인터넷 연결이 필요하지 않습니다. 하지만, AWS Key Management Service 같이 퍼블릭 AWS 제품 엔드포인트나 기업 인트라넷 등에서 VPC 외부에 있는 서비스나 리소스에 액세스하도록 Network Address Translation(NAT) 및 VPN 게이트웨이를 구성해야 할 수도 있습니다.

중요

Amazon EMR은 릴리스 4.2 이상에서만 프라이빗 서브넷에서 클러스터 시작 기능을 지원합니다.

Amazon VPC에 대한 자세한 내용은 Amazon VPC 사용 설명서를 참조하세요.

VPC에 대해 자세히 알 수 있는 추가 리소스

다음 주제를 확인하면 VPC 및 서브넷에 대해 자세히 알아볼 수 있습니다.