기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon EMR Serverless를 사용하여 DynamoDB에 연결
이 자습서에서는 미국 지리 이름 위원회
1단계: Amazon S3 버킷에 데이터 업로드
Amazon S3 버킷을 생성하려면 Amazon Simple Storage Service 콘솔 사용 설명서의 버킷 생성의 지침을 따르세요. 에 대한 참조를 새로 생성된 버킷의
이름으로 바꿉니다. 이제 EMR Serverless 애플리케이션이 작업을 실행할 준비가 되었습니다.amzn-s3-demo-bucket
-
다음 명령을
features.zip
사용하여 샘플 데이터 아카이브를 다운로드합니다.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
아카이브에서
features.txt
파일을 추출하고 파일의 처음 몇 줄을 봅니다.unzip features.zip head features.txt
결과는 다음과 비슷해야 합니다.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
여기에 있는 각 줄의 필드는 고유 식별자, 이름, 자연 특성 유형, 상태, 도 단위의 위도, 도 단위의 경도, 피트 단위의 높이를 나타냅니다.
-
Amazon S3에 데이터 업로드
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
2단계: Hive 테이블 생성
Apache Spark 또는 Hive를 사용하여 Amazon S3에 업로드된 데이터가 포함된 새 Hive 테이블을 생성합니다.
3단계: DynamoDB에 데이터 복사
Spark 또는 Hive를 사용하여 데이터를 새 DynamoDB 테이블에 복사합니다.
4단계: DynamoDB에서 데이터 쿼리
Spark 또는 Hive를 사용하여 DynamoDB 테이블을 쿼리합니다.