탐색기로 데이터를 찾아보십시오. SQL - 아마존 EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

탐색기로 데이터를 찾아보십시오. SQL

참고

SQLAmazon EMR 서버리스 대화형 애플리케이션 또는 IAM ID 센터의 신뢰할 수 있는 ID 전파가 활성화된 EMR 스튜디오에서는 Studio용 Explorer가 지원되지 않습니다.

이 주제에서는 Amazon EMR Studio에서 SQL 탐색기를 시작하는 데 도움이 되는 정보를 제공합니다. SQLExplorer는 EMR 클러스터의 데이터 카탈로그에 있는 데이터 소스를 이해하는 데 도움이 되는 작업 공간의 단일 페이지 도구입니다. SQLExplorer를 사용하여 데이터를 탐색하고, SQL 쿼리를 실행하여 데이터를 검색하고, 쿼리 결과를 다운로드할 수 있습니다.

SQL익스플로러는 프레스토를 지원합니다. SQLExplorer를 사용하기 전에 Amazon EMR 버전 5.34.0 이상 또는 Presto가 설치된 버전 6.4.0 이상을 사용하는 클러스터가 있는지 확인하십시오. Amazon EMR Studio SQL Explorer는 전송 중 암호화로 구성한 Presto 클러스터를 지원하지 않습니다. 이는 Presto가 이러한 클러스터에서 TLS 모드로 실행되기 때문입니다.

클러스터의 데이터 카탈로그 찾아보기

SQLExplorer는 데이터 구성 방식을 탐색하고 이해하는 데 사용할 수 있는 카탈로그 브라우저 인터페이스를 제공합니다. 예를 들어 SQL 쿼리를 작성하기 전에 데이터 카탈로그 브라우저를 사용하여 테이블 및 열 이름을 확인할 수 있습니다.

데이터 카탈로그를 찾아보는 방법
  1. 작업 공간에서 SQL Explorer를 엽니다.

  2. 작업공간이 Presto가 설치된 Amazon EMR 버전 6.4.0 이상을 사용하는 EMR 클러스터에서 EC2 실행되는 클러스터에 연결되어 있는지 확인하십시오. 기존 키 페어를 선택하거나 새로 생성할 수 있습니다. 자세한 내용은 EMRStudio 작업 공간에 컴퓨팅 연결 단원을 참조하십시오.

  3. 드롭다운 목록에서 데이터베이스를 선택하여 찾습니다.

  4. 데이터베이스의 테이블을 확장하여 테이블의 열 이름을 확인합니다. 검색 표시줄에 키워드를 입력하여 테이블 결과를 필터링할 수도 있습니다.

SQL쿼리를 실행하여 데이터를 검색하십시오.

SQL쿼리로 데이터를 검색하고 결과를 다운로드하려면
  1. 워크스페이스에서 SQL 탐색기를 엽니다.

  2. 작업 공간이 EC2 Presto와 Spark가 EMR 설치된 상태에서 실행되는 클러스터에 연결되어 있는지 확인하십시오. 기존 키 페어를 선택하거나 새로 생성할 수 있습니다. 자세한 내용은 EMRStudio 작업 공간에 컴퓨팅 연결 단원을 참조하십시오.

  3. 편집기 열기를 선택하여 Workspace에서 새 편집기 탭을 엽니다.

  4. 편집기 탭에서 SQL 쿼리를 작성하세요.

  5. Run(실행)을 선택합니다.

  6. 결과 미리보기에서 쿼리 결과를 확인합니다. SQL탐색기에는 기본적으로 처음 100개의 결과가 표시됩니다. 처음 100개의 쿼리 결과 미리 보기 드롭다운을 사용하여 표시할 여러 결과 수(최대 1,000개)를 선택할 수 있습니다.

  7. 결과 다운로드를 선택하여 결과를 CSV 형식으로 다운로드합니다. 최대 1,000행의 결과를 다운로드할 수 있습니다.