클러스터를 호스팅VPC하도록 설정 - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

클러스터를 호스팅VPC하도록 설정

에서 클러스터를 시작하려면 먼저 VPC 및 서브넷을 생성VPC해야 합니다. 퍼블릭 서브넷의 경우 인터넷 게이트웨이를 생성하여 서브넷에 연결해야 합니다. 다음 지침은 Amazon EMR 클러스터를 호스팅할 VPC 수 있는 를 생성하는 방법을 설명합니다.

Amazon EMR 클러스터의 서브넷이 VPC 있는 를 생성하려면
  1. 에서 Amazon VPC 콘솔을 엽니다https://console.aws.amazon.com/vpc/.

  2. 페이지 오른쪽 상단에서 에 AWS 리전 대한 를 선택합니다VPC.

  3. 생성을 VPC선택합니다.

  4. VPC 설정 페이지에서 VPC 및 기타 를 선택합니다.

  5. 이름 태그 자동 생성 에서 자동 생성을 활성화하고 의 이름을 입력합니다VPC. 이렇게 하면 Amazon VPC 콘솔을 생성한 후 Amazon 콘솔에서 VPC 및 서브넷을 식별하는 데 도움이 됩니다.

  6. IPv4 CIDR 블록 필드에 의 프라이빗 IP 주소 공간을 입력하여 DNS 호스트 이름이 올바르게 확인VPC되도록 합니다. 그렇지 않으면 Amazon EMR 클러스터 오류가 발생할 수 있습니다. 여기에는 다음 IP 주소 범위가 포함됩니다.

    • 10.0.0.0 - 10.255.255.255

    • 172.16.0.0 - 172.31.255.255

    • 192.168.0.0 - 192.168.255.255

  7. 가용 영역 수(AZs)에서 서브넷을 시작할 가용 영역 수를 선택합니다.

  8. 퍼블릭 서브넷 수 에서 에 추가할 단일 퍼블릭 서브넷을 선택합니다VPC. 클러스터에서 사용하는 데이터를 인터넷(예: Amazon S3 또는 Amazon RDS)에서 사용할 수 있는 경우 퍼블릭 서브넷만 사용하면 되며 프라이빗 서브넷을 추가할 필요가 없습니다.

  9. 프라이빗 서브넷 수 에서 에 추가할 프라이빗 서브넷 수를 선택합니다VPC. 애플리케이션 데이터가 자체 네트워크(예: Oracle 데이터베이스)에 저장된 경우 하나 이상을 선택합니다. 프라이빗 서브넷VPC의 의 경우 모든 Amazon EC2 인스턴스에는 최소한 탄력적 네트워크 인터페이스를 EMR 통해 Amazon으로 가는 경로가 있어야 합니다. 콘솔에서는 이 설정이 자동으로 구성됩니다.

  10. NAT 게이트웨이 에서 선택적으로 NAT 게이트웨이 추가를 선택합니다. 인터넷과 통신해야 하는 프라이빗 서브넷이 있는 경우에만 프라이빗 서브넷이 필요합니다.

  11. VPC 엔드포인트 에서 선택적으로 Amazon S3에 대한 엔드포인트를 서브넷에 추가하도록 선택합니다.

  12. DNS 호스트 이름 활성화 DNS 해상도 활성화가 선택되어 있는지 확인합니다. 자세한 내용은 DNS에서 사용을 참조하세요VPC.

  13. 생성을 VPC선택합니다.

  14. 상태 창에 진행 중인 작업이 표시됩니다. 작업이 완료되면 보기를 VPC 선택하여 기본값VPC과 방금 생성한 VPC를 표시하는 내 VPCs 페이지로 이동합니다. VPC 생성한 는 기본값이 아니므로 기본 VPC 열VPC에 아니요가 표시됩니다.

  15. 를 도메인 이름이 포함되지 않은 VPC DNS 항목에 연결하려면 DHCP 옵션 세트 로 이동하고 DHCP 옵션 세트 생성을 선택한 다음 도메인 이름을 생략합니다. 옵션 세트를 생성한 후 새 로 이동하고 작업 메뉴에서 DHCP 옵션 세트 편집을 VPC선택한 다음 새 옵션 세트를 선택합니다. DNS 옵션 세트가 생성된 후에는 콘솔을 사용하여 도메인 이름을 편집할 수 없습니다.

    노드의 정규화된 도메인 이름(FQDN)을 확인하는 것이 Hadoop 및 관련 애플리케이션의 모범 사례입니다. 적절한 DNS 해결을 위해 파라미터가 다음 값으로 설정된 DHCP 옵션 세트가 VPC 포함된 를 구성합니다.

    • domain-name = ec2.internal

      리전이 미국 동부(버지니아 북부)인 경우 ec2.internal을 사용합니다. 다른 리전의 경우 를 사용합니다.region-name.compute.internal. 의 예제에서는 를 us-west-2사용합니다us-west-2.compute.internal. AWS GovCloud (미국 서부) 리전의 경우 를 사용합니다us-gov-west-1.compute.internal.

    • domain-name-servers = AmazonProvidedDNS

    자세한 내용은 Amazon VPC 사용 설명서DHCP 옵션 세트를 참조하세요.

  16. VPC 이 생성된 후 서브넷 페이지로 이동하여 새 의 서브넷 중 하나의 서브넷 ID를 기록해 둡니다VPC. 에서 Amazon EMR 클러스터를 시작할 때 이 정보를 사용합니다VPC.