EMRStudio 작업 공간에 컴퓨팅 연결 - 아마존 EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

EMRStudio 작업 공간에 컴퓨팅 연결

Amazon EMR Studio는 EMR 클러스터의 커널을 사용하여 노트북 명령을 실행합니다. 커널을 선택하기 전에 Amazon EC2 인스턴스를 사용하는 클러스터, Amazon EMR 온 EKS 클러스터 또는 EMR 서버리스 애플리케이션에 Workspace를 연결해야 합니다. EMRStudio를 사용하면 Workspaces를 새 클러스터나 기존 클러스터에 연결하고 Workspace를 닫지 않고도 클러스터를 변경할 수 있는 유연성을 제공합니다.

이 섹션에서는 EMR Studio용 클러스터를 사용하고 클러스터를 프로비저닝하는 데 도움이 되는 다음 항목을 다룹니다.

Amazon EC2 클러스터를 EMR 스튜디오 워크스페이스에 연결

Workspace를 생성할 때 EC2 Amazon에서 실행되는 EMR 클러스터를 Workspace에 연결하거나 기존 Workspace에 클러스터를 연결할 수 있습니다. 클러스터를 생성 및 연결하려면 새 EMR 클러스터를 생성하여 Studio EMR Workspace에 연결합니다. 섹션을 참조하세요.

참고

IAMIdentity Center의 신뢰할 수 있는 ID 전파가 활성화된 스튜디오의 작업 영역은 Identity Center가 활성화된 보안 구성의 EMR 클러스터에만 연결할 수 있습니다.

On create
Workspace를 생성할 때 Amazon EMR 컴퓨팅 클러스터에 연결
  1. Workspace 생성 대화 상자에서 새 Workspace의 서브넷을 이미 선택했는지 확인합니다. 고급 구성 섹션을 확장합니다.

  2. [EMR클러스터에 워크스페이스 연결] 을 선택합니다.

  3. EMR클러스터 드롭다운 목록에서 작업 공간에 연결할 기존 EMR 클러스터를 선택합니다.

클러스터를 연결한 후 Workspace 생성을 완료합니다. 새 Workspace를 처음 열고 EMR클러스터 패널을 선택하면 선택한 클러스터가 연결된 것을 볼 수 있습니다.

On launch
Workspace를 시작할 때 Amazon EMR 컴퓨팅 클러스터에 연결
  1. Workspace 목록으로 이동하여 시작하려는 Workspace의 행을 선택합니다. 그런 다음 Workspace 시작 > 옵션으로 시작을 선택합니다.

  2. 워크스페이스에 연결할 EMR 클러스터를 선택합니다.

클러스터를 연결한 후 Workspace 생성을 완료합니다. 새 Workspace를 처음 열고 EMR클러스터 패널을 선택하면 선택한 클러스터가 연결된 것을 볼 수 있습니다.

In JupyterLab
워크스페이스를 Amazon EMR 컴퓨팅 클러스터에 연결 JupyterLab
  1. Workspace를 선택하고 Workspace 시작 > 빠른 시작을 선택합니다.

  2. 안에서 JupyterLab 왼쪽 사이드바의 클러스터 탭을 엽니다.

  3. EMR온 EC2 클러스터 드롭다운을 선택하거나 Amazon EMR on EKS 클러스터를 선택합니다.

  4. 연결을 선택하여 클러스터를 Workspace에 연결합니다.

클러스터를 연결한 후 Workspace 생성을 완료합니다. 새 Workspace를 처음 열고 EMR클러스터 패널을 선택하면 선택한 클러스터가 연결된 것을 볼 수 있습니다.

In the Workspace UI
Workspace 사용자 인터페이스에서 Amazon EMR 컴퓨팅 클러스터에 워크스페이스를 연결합니다.
  1. 클러스터에 연결하려는 작업 공간의 왼쪽 사이드바에서 EMR클러스터 아이콘을 선택하여 클러스터 패널을 엽니다.

  2. 클러스터 유형에서 드롭다운을 확장하고 EMR클러스터 온을 선택합니다. EC2

  3. 드롭다운 목록에서 클러스터를 선택합니다. 클러스터 선택 드롭다운 목록을 활성화하려면 먼저 기존 클러스터를 분리해야 할 수 있습니다.

  4. 연결을 선택합니다. 클러스터가 연결되면 성공 메시지가 표시됩니다.

Amazon EMR 온 EKS 클러스터를 EMR 스튜디오 작업 공간에 연결

Amazon에서 실행되는 Amazon EMR 클러스터를 사용하는 것 외에도 Workspace를 Amazon EMR 온 EKS 클러스터에 연결하여 노트북 코드를 실행할 수 있습니다. EC2 Amazon EMR EKS on에 대한 자세한 내용은 Amazon이란 무엇입니까? EMR 를 참조하십시오EKS.

Workspace를 Amazon EMR on EKS 클러스터에 연결하려면 먼저 Studio 관리자가 액세스 권한을 부여해야 합니다.

참고

IAMIdentity Center의 신뢰할 수 있는 ID 전파를 사용하는 EMR 스튜디오에서는 EKS 클러스터에서 EMR Amazon을 시작할 수 없습니다.

On create
작업 공간을 생성할 때 Amazon EMR on EKS 클러스터를 연결하려면
  1. Workspace 생성 대화 상자에서 고급 구성 섹션을 확장합니다.

  2. EKS클러스터의 EMR Amazon에 작업 영역 연결을 선택합니다.

  3. Amazon EMR on EKS cluster의 드롭다운 목록에서 클러스터를 선택합니다.

  4. 엔드포인트 선택에서 Workspace에 연결할 관리형 엔드포인트를 선택합니다. 관리형 엔드포인트는 EMR Studio가 선택한 클러스터와 통신할 수 있게 해주는 게이트웨이입니다.

  5. Workspace 생성을 선택하여 Workspace 생성 프로세스를 완료하고 선택한 클러스터를 연결합니다.

클러스터를 연결한 후 Workspace 생성 프로세스를 완료할 수 있습니다. 새 Workspace를 처음 열고 EMR클러스터 패널을 선택하면 선택한 클러스터가 연결된 것을 확인할 수 있습니다.

In the Workspace UI
Workspace 사용자 인터페이스에서 Amazon EMR on EKS 클러스터를 연결하려면
  1. 클러스터에 연결하려는 작업 공간의 왼쪽 사이드바에서 EMR클러스터 아이콘을 선택하여 클러스터 패널을 엽니다.

  2. 클러스터 유형 드롭다운을 확장하고 EMR클러스터 켜기를 선택합니다. EKS

  3. EMR클러스터 온의 EKS 드롭다운 목록에서 클러스터를 선택합니다.

  4. 엔드포인트에서 Workspace에 연결할 관리형 엔드포인트를 선택합니다. 관리형 엔드포인트는 EMR Studio가 선택한 클러스터와 통신할 수 있게 해주는 게이트웨이입니다.

  5. 연결을 선택합니다. 클러스터가 연결되면 성공 메시지가 표시됩니다.

Amazon EMR 서버리스 애플리케이션을 EMR 스튜디오 워크스페이스에 연결

Workspace를 EMR 서버리스 애플리케이션에 연결하여 대화형 워크로드를 실행할 수 있습니다. 자세한 내용은 노트북을 사용하여 Studio를 통해 서버리스로 EMR 대화형 워크로드 실행을 참조하십시오. EMR

참고

IAMIdentity Center의 신뢰할 수 있는 ID 전파를 사용하는 EMR Studio에는 EMR 서버리스 애플리케이션을 연결할 수 없습니다.

예 의 EMR 서버리스 애플리케이션에 작업 영역 연결 JupyterLab

Workspace를 EMR 서버리스 애플리케이션에 연결하려면 먼저 계정 관리자가 대화형 워크로드에 필요한 권한에 설명된 대로 액세스 권한을 부여해야 합니다.

  1. EMRStudio로 이동하여 작업 영역을 선택한 다음 작업 영역 시작 > 빠른 실행을 선택합니다.

  2. 안에서 JupyterLab 왼쪽 사이드바의 클러스터 탭을 엽니다.

  3. 컴퓨팅 옵션으로 EMR서버리스를 선택한 다음 EMR 서버리스 애플리케이션과 런타임 역할을 선택합니다.

  4. 클러스터를 Workspace에 연결하려면 연결을 선택합니다.

이제 이 Workspace를 열면 선택한 애플리케이션이 연결된 것을 확인할 수 있습니다.

새 EMR 클러스터를 생성하여 Studio EMR Workspace에 연결합니다.

Advanced EMR Studio 사용자는 Amazon에서 실행되는 새 EMR 클러스터를 EC2 프로비저닝하여 Workspace와 함께 사용할 수 있습니다. 새 클러스터에는 EMR Studio에 필요한 모든 빅 데이터 애플리케이션이 기본적으로 설치되어 있습니다.

클러스터를 생성하려면 Studio 관리자가 먼저 세션 정책을 사용하여 권한을 부여해야 합니다. 자세한 내용은 EMRStudio 사용자를 위한 권한 정책을 생성하십시오. 단원을 참조하십시오.

Workspace 생성 대화 상자 또는 Workspace UI의 클러스터 패널에서 새 클러스터를 생성할 수 있습니다. 어느 쪽이든 다음 두 가지 클러스터 생성 옵션이 제공됩니다.

  1. EMR클러스터 생성 - Amazon EC2 인스턴스 유형과 개수를 선택하여 EMR 클러스터를 생성합니다.

  2. 클러스터 템플릿 사용 - 사전 정의된 클러스터 템플릿을 선택하여 클러스터를 프로비저닝합니다. 이 옵션은 클러스터 템플릿을 사용할 권한이 있는 경우에 나타납니다.

    참고

    스튜디오용 Identity Center를 사용하여 신뢰할 수 있는 IAM ID 전파를 활성화한 경우 템플릿을 사용하여 클러스터를 생성해야 합니다.

EMR클러스터 구성을 제공하여 클러스터를 만들려면
  1. 시작 지점을 선택합니다.

    원하는 작업 수행할 작업
    Workspace 생성 대화 상자를 사용하여 Workspace를 생성할 때 클러스터를 생성합니다. 작업 영역 생성 대화 상자에서 고급 구성 섹션을 확장하고 EMR클러스터 생성을 선택합니다.
    Workspace를 생성한 후 Workspace UI의 EMR클러스터 패널에서 클러스터를 생성합니다. 열려 있는 작업 영역의 왼쪽 사이드바에서 EMR클러스터 탭을 선택하고 고급 구성 섹션을 확장한 다음 클러스터 생성을 선택합니다.
  2. 클러스터 이름을 입력합니다. 클러스터의 이름을 지정하면 나중에 EMR Studio 클러스터 목록에서 클러스터를 찾을 수 있습니다.

  3. Amazon EMR 릴리스의 경우 클러스터의 Amazon EMR 릴리스 버전을 선택하십시오.

  4. [Instance] 에서 클러스터의 Amazon EC2 인스턴스 유형 및 수를 선택합니다. 인스턴스 유형 선택에 대한 자세한 내용은 Amazon EC2 인스턴스 구성 섹션을 참조하세요. 인스턴스 하나가 프라이머리 노드에 사용됩니다.

  5. EMRStudio가 새 클러스터를 시작할 수 있는 서브넷을 선택합니다. 각 서브넷 옵션은 Studio 관리자의 사전 승인을 받으며 Workspace는 나열된 모든 서브넷의 클러스터에 연결할 수 있어야 합니다.

  6. 로그 URI 스토리지용 S3를 선택합니다.

  7. EMR클러스터 생성을 선택하여 클러스터를 프로비저닝합니다. Workspace 생성 대화 상자를 사용하는 경우 Workspace 생성을 선택하여 Workspace를 생성하고 클러스터를 프로비저닝합니다. EMRStudio는 새 클러스터를 프로비저닝한 후 클러스터를 Workspace에 연결합니다.

클러스터 템플릿 사용하여 클러스터를 생성하는 방법
  1. 시작 지점을 선택합니다.

    원하는 작업 수행할 작업
    Workspace 생성 대화 상자를 사용하여 Workspace를 생성할 때 클러스터를 생성합니다. Workspace 생성 대화 상자에서 고급 구성 섹션을 확장하고 클러스터 템플릿 사용을 선택합니다.
    Workspace UI의 EMR클러스터 패널에서 클러스터를 생성합니다. 열려 있는 작업 영역의 왼쪽 사이드바에서 EMR클러스터 탭을 선택하고 고급 구성 섹션을 확장한 다음 클러스터 템플릿을 선택합니다.
  2. 드롭다운 목록에서 클러스터 템플릿을 선택합니다. 사용 가능한 각 클러스터 템플릿에는 선택에 도움이 되는 간략한 설명이 포함되어 있습니다.

  3. 선택한 클러스터 템플릿에는 Amazon EMR 릴리스 버전 또는 클러스터 이름과 같은 추가 매개변수가 있을 수 있습니다. 값을 선택 또는 삽입하거나 관리자가 선택한 기본값을 사용할 수 있습니다.

  4. EMRStudio가 새 클러스터를 시작할 수 있는 서브넷을 선택합니다. 각 서브넷 옵션은 Studio 관리자의 사전 승인을 받으며 Workspace는 모든 서브넷의 클러스터에 연결할 수 있어야 합니다.

  5. 클러스터 템플릿 사용을 선택하여 클러스터를 프로비전하고 Workspace에 연결합니다. EMRStudio가 클러스터를 생성하는 데 몇 분 정도 걸립니다. Workspace 생성 대화 상자를 사용하는 경우 Workspace 생성을 선택하여 Workspace를 생성하고 클러스터를 프로비저닝합니다. EMRStudio가 새 클러스터를 프로비저닝한 후 클러스터를 Workspace에 연결합니다.

Studio EMR Workspace에서 컴퓨팅 분리

Workspace에 연결된 클러스터를 교환하려면 Workspace UI에서 클러스터를 분리하면 됩니다.

WorkSpaces에서 클러스터를 분리하는 방법
  1. 클러스터에서 분리하려는 작업 공간의 왼쪽 사이드바에서 EMR클러스터 아이콘을 선택하여 클러스터 패널을 엽니다.

  2. 클러스터 선택에서 분리를 선택하고 EMR Studio가 클러스터를 분리할 때까지 기다립니다. 클러스터가 분리되면 성공 메시지가 표시됩니다.

Studio Workspace에서 EMR 서버리스 애플리케이션을 분리하려면 EMR

Workspace에 연결된 컴퓨팅을 교환하려면 Workspace UI에서 애플리케이션을 분리하면 됩니다.

  1. 클러스터에서 분리하려는 작업 공간의 왼쪽 사이드바에서 Amazon EMR 컴퓨팅 아이콘을 선택하여 Compute 패널을 엽니다.

  2. 컴퓨팅 선택에서 분리를 선택하고 EMR Studio가 애플리케이션을 분리할 때까지 기다립니다. 애플리케이션이 분리되면 성공 메시지가 표시됩니다.