Amazon EMR 클러스터를 시작하는 경우 애플리케이션 구성
소프트웨어 릴리스를 선택하면 Amazon EMR은 Amazon Linux에서 AMI(Amazon Machine Image)를 사용하여 Hadoop, Spark 및 Hive와 같은 클러스터를 시작할 때 선택한 소프트웨어를 설치합니다. Amazon EMR은 주기적으로 새 릴리스를 제공하여 새 기능, 새 애플리케이션 및 일반 업데이트를 추가합니다. 가능할 때마다 최신 릴리스를 사용하여 클러스터를 시작하는 것이 좋습니다. 콘솔에서 클러스터를 시작할 때 최신 릴리스가 기본 옵션입니다.
Amazon EMR 릴리스 및 각 릴리스에서 사용 가능한 소프트웨어 버전에 대한 자세한 내용은 Amazon EMR 릴리스 안내서를 참조하세요. 클러스터에 설치된 애플리케이션 및 소프트웨어의 기본 구성을 편집하는 방법에 대한 자세한 내용은 Amazon EMR 릴리스 안내서에서 애플리케이션 구성을 참조하세요. Amazon EMR 릴리스에 포함된 일부 오픈 소스 Hadoop 및 Spark 에코시스템 구성 요소 버전에는 패치 및 개선 사항이 있으며, 이는 Amazon EMR 릴리스 안내서에 설명되어 있습니다.
표준 소프트웨어 및 클러스터에 설치할 수 있는 애플리케이션 외에도 부트스트랩 작업을 사용하여 사용자 지정 소프트웨어를 설치할 수 있습니다. 부트스트랩 작업은 클러스터가 실행될 때 인스턴스에서 실행되고 클러스터가 작성될 때 클러스터에 추가되는 새 노드에서 실행되는 스크립트입니다. 부트스트랩 작업은 Amazon S3의 객체를 클러스터의 각 노드에 복사하기 위한 AWS CLI 명령을 각 노드에서 간접 호출하는 데도 유용합니다.
참고
부트스트랩 작업은 Amazon EMR 릴리스 4.x 이상에서 다르게 사용됩니다. Amazon EMR AMI 버전 2.x 및 3.x의 차이점에 대한 자세한 내용은 Amazon EMR 릴리스 안내서에서 4.x에 도입된 차이점을 참조하세요.