자습서: Amazon DynamoDB 및 Apache Hive 작업

이 자습서에서는 Amazon EMR 클러스터를 시작한 다음 Apache Hive를 사용하여 DynamoDB 테이블에 저장된 데이터를 처리합니다.

Hive는 여러 소스의 데이터를 처리 및 분석할 수 있게 해주는, Hadoop용 데이터 웨어하우스 애플리케이션입니다. Hive는 SQL과 유사한 언어인 HiveQL을 제공합니다. 이 언어를 사용하면 Amazon EMR 클러스터에 로컬로 저장된 데이터 또는 외부 데이터 원본(예: Amazon DynamoDB)에 저장된 데이터로 작업할 수 있습니다.

자세한 내용은 Hive Tutorial을 참조하세요.

주제

시작하기 전 준비 사항

이 자습서를 이해하려면 다음이 필요합니다.

AWS 계정. 계정이 없을 경우 AWS 계정에 가입 단원을 참조하세요.
SSH 클라이언트(Secure Shell). SSH 클라이언트를 사용하여 Amazon EMR 클러스터의 리더 노드에 연결하고 대화형 명령을 실행합니다. SSH 클라이언트는 대부분의 Linux, Unix 및 Mac OS X 설치 시 기본적으로 사용됩니다. Windows 사용자는 SSH가 지원되는 PuTTY 클라이언트를 다운로드하여 설치하면 됩니다.

다음 단계

1단계: Amazon EC2 키 페어 생성

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

Amazon EMR과 통합

1단계: Amazon EC2 키 페어 생성