클러스터에 연결 - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

클러스터에 연결

Amazon EMR 클러스터를 실행할 때는 애플리케이션을 실행하여 데이터를 분석한 다음 Amazon S3 버킷에서 출력을 수집하기만 하면 되는 경우가 많습니다. 다른 경우에는 클러스터가 실행되는 동안 프라이머리 노드와 상호 작용할 수도 있습니다. 예를 들어, 프라이머리 노드에 연결하여 대화형 쿼리를 실행하고, 로그 파일을 검사하며, 클러스터의 문제를 디버깅하고, 프라이머리 노드에서 실행되는 Ganglia 같은 애플리케이션을 사용하여 성능을 모니터링하는 등 다양한 작업을 수행할 수 있습니다. 다음 섹션에서는 프라이머리 노드에 연결하는 데 사용할 수 있는 기술을 설명합니다.

EMR클러스터에서 기본 노드는 작업 및 코어 노드로 실행되는 EC2 인스턴스를 조정하는 Amazon EC2 인스턴스입니다. 기본 노드는 연결하는 데 사용할 수 있는 공개 DNS 이름을 노출합니다. 기본적으로 Amazon은 기본 노드와 코어 및 태스크 노드에 대해 사용자가 노드에 액세스하는 방법을 결정하는 보안 그룹 규칙을 EMR 생성합니다.

참고

클러스터가 실행 중일 때만 프라이머리 노드에 연결할 수 있습니다. 클러스터가 종료되면 기본 노드 역할을 하는 EC2 인스턴스가 종료되어 더 이상 사용할 수 없게 됩니다. 프라이머리 노드를 연결하려면 클러스터에 대한 인증을 수행해야 합니다. 인증에 Kerberos를 사용하거나 클러스터를 시작할 때 Amazon EC2 키 페어 프라이빗 키를 지정할 수 있습니다. Kerberos의 구성 및 연결에 대한 자세한 내용은 Amazon 인증에 Kerberos 사용 EMR을 참조하십시오. 콘솔에서 클러스터를 시작하면 Amazon EC2 키 페어 프라이빗 키는 클러스터 생성 페이지의 보안 및 액세스 섹션에 지정됩니다.

기본적으로 ElasticMapReduce -master 보안 그룹은 인바운드 SSH 액세스를 허용하지 않습니다. 액세스하려는 소스로부터의 SSH 액세스 (TCP포트 22) 를 허용하는 인바운드 규칙을 추가해야 할 수도 있습니다. 보안 그룹 규칙 수정에 대한 자세한 내용은 Amazon EC2 User Guide의 보안 그룹에 규칙 추가를 참조하십시오.

중요

ElasticMapReduce-master 보안 그룹의 나머지 규칙은 수정하지 마십시오. 이러한 규칙을 수정하면 클러스터 작업이 방해받을 수 있습니다.