Workspace 기본 사항 알아보기 - 아마존 EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Workspace 기본 사항 알아보기

EMR스튜디오를 사용하면 노트북을 구성하고 실행하기 위한 다양한 작업 공간을 만들고 구성할 수 있습니다. 이 섹션에서는 Workspace 생성 및 사용에 대해 다룹니다. 개념적 개요는 Amazon EMR Studio 작동 방식 페이지에서 WorkSpaces 섹션을 참조하세요.

EMRStudio 작업 영역 만들기

EMRStudio 인터페이스를 사용하여 노트북 코드를 실행하는 EMR Studio 작업 영역을 만들 수 있습니다.

스튜디오에서 워크스페이스를 EMR 만들려면
  1. EMR스튜디오에 로그인하세요.

  2. Workspace 생성을 선택합니다.

  3. Workspace 이름설명을 입력합니다. Workspace에 이름을 지정하면 Workspace 페이지에서 Workspace를 쉽게 식별할 수 있습니다.

  4. 이 Workspace에서 다른 Studio 사용자와 실시간으로 작업하려면 Workspace 협업을 활성화합니다. Workspace를 시작한 후 공동 작업자를 구성할 수 있습니다.

  5. 클러스터를 Workspace에 연결하려면 고급 구성 섹션을 확장합니다. 원하는 경우 나중에 클러스터를 연결할 수 있습니다. 자세한 내용은 EMRStudio 작업 공간에 컴퓨팅 연결 단원을 참조하십시오.

    참고

    새 클러스터를 프로비전하려면 관리자의 액세스 권한이 필요합니다.

    Workspace의 클러스터 옵션 중 하나를 선택하고 클러스터를 연결합니다. Workspace를 생성할 때 클러스터를 프로비저닝하는 방법에 대한 자세한 내용은 새 EMR 클러스터를 생성하여 Studio EMR Workspace에 연결합니다. 섹션을 참조하세요.

  6. 페이지 오른쪽 하단에서 Workspace 생성을 선택합니다.

워크스페이스를 생성하면 EMR Studio에서 워크스페이스 페이지가 열립니다. 페이지 상단에 녹색 성공 배너가 표시되며 목록에서 새로 생성된 Workspace를 찾을 수 있습니다.

기본적으로 Workspace는 공유되며 모든 Studio 사용자가 볼 수 있습니다. 하지만 한 번에 한 명의 사용자만 Workspace를 열고 작업할 수 있습니다. 다른 사용자와 동시에 작업하려면 Workspace 협업 구성 작업을 수행하면 됩니다.

Workspace 시작

노트북 파일 작업을 시작하려면 Workspace를 실행하여 노트북 편집기에 액세스합니다. Studio의 Workspace 페이지에는 액세스할 수 있는 모든 Workspace와 함께 이름, 상태, 생성 시간, 최종 수정 등의 세부 정보와 나열됩니다.

참고

이전 Amazon EMR 콘솔에 EMR 노트북이 있었다면 콘솔에서 EMR Studio Workspaces로 찾을 수 있습니다. EMR노트북 사용자가 워크스페이스에 액세스하거나 워크스페이스를 생성하려면 추가 IAM 역할 권한이 필요합니다. 최근에 이전 콘솔에서 노트북을 만든 경우 콘솔에서 해당 노트북을 보려면 워크스페이스 목록을 새로 고쳐야 할 수 있습니다. 전환에 대한 자세한 내용은 Amazon EMR 노트북은 콘솔에서 Amazon EMR 스튜디오 워크스페이스로 사용할 수 있습니다.아마존 EMR 콘솔 섹션을 참조하세요.

노트북을 편집하고 실행하기 위해 Workspace를 시작하는 방법
  1. Studio의 Workspace 페이지에서 Workspace를 찾습니다. 키워드나 열 값을 기준으로 목록을 필터링할 수 있습니다.

  2. Workspace 이름을 선택하여 새 브라우저 탭에서 Workspace를 시작합니다. Workspace가 유휴 상태인 경우 여는 데 몇 분 정도 걸릴 수 있습니다. 또는 Workspace 행을 선택하고 Workspace 시작을 선택할 수도 있습니다. 다음 시작 옵션 중에서 선택할 수 있습니다.

    • 빠른 실행 - 기본 옵션을 사용하여 Workspace를 빠르게 시작합니다. 에서 JupyterLab Workspace에 클러스터를 연결하려면 [빠른 실행] 을 선택합니다.

    • 옵션으로 시작 - 사용자 지정 옵션을 사용하여 Workspace를 시작합니다. Jupyter에서 시작하거나 JupyterLab 작업 공간을 EMR 클러스터에 연결하고 보안 그룹을 선택할 수 있습니다.

    참고

    한 번에 한 명의 사용자만 Workspace를 열고 작업할 수 있습니다. 이미 사용 중인 작업 영역을 선택하면 해당 작업 영역을 열려고 하면 EMR Studio에 알림이 표시됩니다. Workspace 페이지의 사용자 열에는 Workspace에서 작업하는 사용자가 표시됩니다.

Workspace 사용자 인터페이스 이해

EMRStudio Workspace 사용자 인터페이스는 왼쪽 사이드바에 아이콘으로 표시된 탭이 있는 JupyterLab인터페이스를 기반으로 합니다. 아이콘 위에서 잠시 멈추면 탭 이름을 보여주는 도구 설명을 볼 수 있습니다. 왼쪽 사이드바에서 탭을 선택하여 다음 패널에 액세스합니다.

  • 파일 브라우저 - Workspace의 파일 및 디렉터리는 물론 연결된 Git 리포지토리의 파일 및 디렉터리도 표시합니다.

  • 커널 및 터미널 실행 - Workspace에서 실행 중인 모든 커널과 터미널을 나열합니다. 자세한 내용은 공식 설명서의 커널 및 터미널 관리를 참조하십시오. JupyterLab

  • Git - Workspace에 연결된 Git 리포지토리에서 명령을 수행할 수 있는 그래픽 사용자 인터페이스를 제공합니다. 이 패널은 JupyterLab jupyterlab-git이라는 확장 프로그램입니다. 자세한 내용은 jupyterlab-git을 참조하세요.

  • EMR클러스터 - 클러스터를 작업 공간에 연결하거나 작업 공간에서 분리하여 노트북 코드를 실행할 수 있습니다. EMR클러스터 구성 패널은 또한 클러스터를 생성하여 Workspace에 연결하는 데 도움이 되는 고급 구성 옵션을 제공합니다. 자세한 내용은 새 EMR 클러스터를 생성하여 Studio EMR Workspace에 연결합니다. 단원을 참조하십시오.

  • Amazon EMR Git 리포지토리 — 워크스페이스를 최대 3개의 Git 리포지토리와 연결할 수 있도록 도와줍니다. 자세한 내용과 지침은 Git 기반 리포지토리를 스튜디오 워크스페이스에 연결 EMR 섹션을 참조하세요.

  • 노트북 예제 - Workspace에 저장할 수 있는 노트북 예제 목록을 제공합니다. Workspace의 시작 관리자 페이지에서 노트북 예제를 선택하여 예제에 액세스할 수도 있습니다.

  • 명령 — 키보드 기반 방식으로 명령을 검색하고 실행할 수 있습니다. JupyterLab 자세한 내용은 설명서의 명령 팔레트 페이지를 참조하십시오. JupyterLab

  • 노트북 도구 - 셀 슬라이드 유형 및 메타데이터와 같은 옵션을 선택하고 설정할 수 있습니다. 노트북 파일을 열면 왼쪽 사이드바에 노트북 도구 옵션이 나타납니다.

  • 열린 탭 - 열린 탭으로 바로 이동할 수 있도록 기본 작업 영역에 열려 있는 문서 및 활동을 나열합니다. 자세한 내용은 JupyterLab 설명서의 탭 및 단일 문서 모드 페이지를 참조하십시오.

  • 협업 - Workspace 협업을 활성화 또는 비활성화하고 공동 작업자를 관리할 수 있습니다. 협업 패널을 보려면 필수 권한이 있어야 합니다. 자세한 내용은 WorkSpaces 협업에 대한 소유권 설정을 참조하세요.

노트북 예제 살펴보기

모든 EMR Studio Workspace에는 EMR Studio 기능을 탐색하는 데 사용할 수 있는 노트북 예제 세트가 포함되어 있습니다. 노트북 예제를 편집하거나 실행하려면 해당 예제를 Workspace에 저장합니다.

노트북 예제를 Workspace에 저장하는 방법
  1. 왼쪽 사이드바에서 노트북 예제 탭을 선택하여 노트북 예제 패널을 엽니다. Workspace의 시작 관리자 페이지에서 노트북 예제를 선택하여 예제에 액세스할 수도 있습니다.

  2. 노트북 예제를 선택하여 기본 작업 영역에서 미리 볼 수 있습니다. 이 예제는 읽기 전용입니다.

  3. 노트북 예제를 Workspace에 저장하려면 Workspace에 저장을 선택합니다. EMRStudio는 예제를 홈 디렉토리에 저장합니다. 노트북 예제를 Workspace에 저장한 후 이름을 바꾸고, 편집하며, 실행할 수 있습니다.

노트북 예제에 대한 자세한 내용은 EMRStudio Notebook 예제 GitHub 저장소를 참조하십시오.

Workspace 콘텐츠 저장

Workspace의 노트북 편집기에서 작업하는 경우 EMR Studio는 노트북 셀의 콘텐츠와 출력을 스튜디오와 연결된 Amazon S3 위치에 저장합니다. 이 백업 프로세스는 세션 간 작업을 보존합니다.

열린 노트북 탭에서 CTRL+S를 누르거나 파일 아래의 저장 옵션 중 하나를 사용하여 노트북을 저장할 수도 있습니다.

Workspace에서 Notebook 파일을 백업하는 또 다른 방법은 Workspace를 Git 기반 리포지토리와 연결하고 변경 내용을 원격 리포지토리와 동기화하는 것입니다. 또한 이렇게 하면 다른 Workspace 또는 Studio를 사용하는 팀원과 노트북을 공유하고 저장할 수 있습니다. 지침은 Git 기반 리포지토리를 스튜디오 워크스페이스에 연결 EMR 단원을 참조하십시오.

Workspace 및 노트북 파일 삭제

EMRStudio Workspace에서 노트북 파일을 삭제하면 파일 브라우저에서 파일이 삭제되고 EMR Studio는 Amazon S3에서 해당 백업 사본을 제거합니다. Workspace에서 파일을 삭제할 때 스토리지 요금이 부과되지 않도록 추가 조치를 취하지 않아도 됩니다.

전체 Workspace를 삭제해도 노트북 파일 및 폴더는 Amazon S3 스토리지 위치에 남아 있습니다. 파일에는 계속해서 스토리지 요금이 누적됩니다. 스토리지 요금이 부과되지 않도록 Amazon S3에서 삭제된 Workspace와 관련된 모든 백업 파일 및 폴더를 제거합니다.

EMR스튜디오 워크스페이스에서 노트북 파일을 삭제하려면
  1. Workspace의 왼쪽 사이드바에서 파일 브라우저 패널을 선택합니다.

  2. 삭제할 파일 또는 폴더를 선택합니다. 선택한 항목을 마우스 오른쪽 버튼으로 클릭하고 삭제를 선택합니다. 목록에서 파일이 사라집니다. EMRStudio는 사용자를 위해 Amazon S3에서 파일 또는 폴더를 제거합니다.

From the Workspace UI
EMRStudio에서 워크스페이스 및 관련 백업 파일을 삭제합니다.
  1. Studio 액세스 권한으로 EMR Studio에 URL 로그인하고 왼쪽 탐색에서 Workspaces를 선택합니다.

  2. 목록에서 Workspace를 찾은 후 이름 옆의 확인란을 선택합니다. 동시에 삭제할 Workspace를 여러 개 선택할 수 있습니다.

  3. Workspace 목록의 오른쪽 상단에서 삭제를 선택하고 선택한 Workspace의 삭제를 확인합니다. [삭제]를 선택하여 확인합니다.

  4. Amazon S3에서 삭제된 작업 Workspace와 연결된 노트북 파일을 제거하려면 Amazon Simple Storage Service 콘솔 사용 설명서에서 객체 삭제 지침을 따릅니다. Studio를 생성하지 않은 경우 Studio 관리자에게 문의하여 삭제된 Workspace의 Amazon S3 백업 위치를 확인합니다.

From the Workspaces list
Workspace 목록에서 Workspace 및 관련 백업 파일 삭제
  1. 콘솔에서 Workspace 목록으로 이동합니다.

  2. 목록에서 삭제하려는 Workspace를 선택하고 작업을 선택합니다.

  3. Delete(삭제)를 선택합니다.

  4. Amazon S3에서 삭제된 작업 Workspace와 연결된 노트북 파일을 제거하려면 Amazon Simple Storage Service 콘솔 사용 설명서에서 객체 삭제 지침을 따릅니다. Studio를 생성하지 않은 경우 Studio 관리자에게 문의하여 삭제된 Workspace의 Amazon S3 백업 위치를 확인합니다.

Workspace 상태 이해

EMRStudio 작업 영역을 만들면 Studio의 작업 영역 목록에 이름, 상태, 생성 시간 및 마지막으로 수정한 타임스탬프가 포함된 행으로 나타납니다. 다음 테이블에서는 WorkSpace 상태를 설명합니다.

상태 표시기 설명
[시작됨] Workspac를 준비 중이지만 아직 사용할 준비가 되지 않았습니다. 상태가 시작 중일 때는 Workspace를 열 수 없습니다.
준비됨 노트북 편집기를 사용하기 위해 작업 영역을 열 수 있지만 노트북 코드를 실행하려면 먼저 작업 영역을 EMR 클러스터에 연결해야 합니다.
연결 Workspace가 클러스터에 연결 중입니다.
연결됨 Workspace는 EMR 클러스터에 연결되어 있으며 노트북 코드를 작성하고 실행할 준비가 되었습니다. Workspace가 연결됨 상태가 아닌 경우 노트북 코드를 실행하려면 먼저 클러스터에 연결해야 합니다.
유휴 Workspace가 중지되었습니다. 유휴 Workspace를 다시 활성화하려면 Workspace 목록에서 해당 Workspace를 선택합니다. Workspace를 선택하면 상태가 유휴에서 시작 중, 준비로 바뀝니다.
[중지 중] Workspace가 종료되고 유휴로 설정됩니다. Workspace를 중지하면 해당하는 모든 노트북 커널이 종료됩니다. EMRStudio는 오랫동안 비활성 상태였던 노트북을 중지합니다.
[삭제 중] 작업 영역을 삭제하면 EMR Studio는 해당 작업 영역을 삭제 대상으로 표시하고 삭제 프로세스를 시작합니다. 삭제 프로세스가 완료되면 Workspace가 목록에서 사라집니다. Workspace를 삭제해도 노트북 파일은 Amazon S3 스토리지 위치에 남아 있습니다.

Workspace 연결 문제 해결

Workspace 연결 문제를 해결하기 위해 Workspace를 중지하고 다시 시작할 수 있습니다. 작업 영역을 다시 시작하면 EMR Studio는 다른 가용 영역 또는 Studio와 연결된 다른 서브넷에서 작업 영역을 시작합니다.

EMRStudio 워크스페이스를 중지하고 다시 시작하려면
  1. 브라우저에서 Workspace를 닫습니다.

  2. 콘솔에서 Workspace 목록으로 이동합니다.

  3. 목록에서 Workspace를 선택하고 작업을 선택합니다.

  4. 중지를 선택하고 Workspace 상태가 중지 중에서 유휴로 변경될 때까지 기다립니다.

  5. 작업을 다시 선택하고 시작을 선택하여 Workspace를 다시 시작합니다.

  6. Workspace 상태가 시작 중에서 준비로 변경될 때까지 기다린 다음 Workspace 이름을 선택하여 새 브라우저 탭에서 Workspace를 다시 엽니다.