Conexión a DynamoDB con Amazon EMR sin servidor
En este tutorial, cargará un subconjunto de datos del United States Board on Geographic Names
Paso 1: cargue los datos en un bucket de Amazon S3
Para crear un bucket de Amazon S3, siga las instrucciones en Crear un bucket en la Guía del usuario de la consola de Amazon Simple Storage Service. Sustituya las referencias a
por el nombre del bucket recién creado. Ahora su aplicación EMR sin servidor está lista para ejecutar trabajos.amzn-s3-demo-bucket
-
Descargue el archivo de datos de ejemplo
features.zip
con el comando siguiente.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
Extraiga el archivo
features.txt
del archivo y visualice las primeras líneas del archivo:unzip features.zip head features.txt
El resultado debería ser similar al siguiente.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
Los campos de cada línea indican un identificador único, nombre, tipo de característica natural, estado, latitud en grados, longitud en grados y altura en pies.
-
Descarga de datos en Amazon S3
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
Paso 2: cree una tabla
Utilice Apache Spark o Hive para crear una nueva tabla de Hive que contenga los datos cargados en Amazon S3.
Paso 3: copie los datos a DynamoDB
Utilice Spark o Hive para copiar los datos a una nueva tabla de DynamoDB.
Paso 4: haga una consulta de datos de DynamoDB
Utilice Spark o Hive para consultar la tabla de DynamoDB.