이 자습서에서는 Amazon EMR 클러스터를 시작한 다음 Apache Hive를 사용하여 DynamoDB 테이블에 저장된 데이터를 처리합니다.
Hive는 여러 소스의 데이터를 처리 및 분석할 수 있게 해주는, Hadoop용 데이터 웨어하우스 애플리케이션입니다. Hive는 SQL과 유사한 언어인 HiveQL을 제공합니다. 이 언어를 사용하면 Amazon EMR 클러스터에 로컬로 저장된 데이터 또는 외부 데이터 원본(예: Amazon DynamoDB)에 저장된 데이터로 작업할 수 있습니다.
자세한 내용은 Hive Tutorial
주제
시작하기 전 준비 사항
이 자습서를 이해하려면 다음이 필요합니다.