Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Conexión a DynamoDB con Amazon Serverless EMR
En este tutorial, cargará un subconjunto de datos del Consejo de Nombres Geográficos de los Estados Unidos
Paso 1: cargue los datos en un bucket de Amazon S3
Para crear un bucket de Amazon S3, siga las instrucciones en Crear un bucket en la Guía del usuario de la consola de Amazon Simple Storage Service. Sustituya las referencias a
por el nombre del bucket recién creado. Ahora su aplicación EMR sin servidor está lista para ejecutar tareas.amzn-s3-demo-bucket
-
Descargue el archivo de datos de ejemplo
features.zip
con el comando siguiente.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
Extraiga el archivo
features.txt
del archivo y visualice las primeras líneas del archivo:unzip features.zip head features.txt
El resultado debería ser similar al siguiente.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
Los campos de cada línea indican un identificador único, nombre, tipo de característica natural, estado, latitud en grados, longitud en grados y altura en pies.
-
Descarga de datos en Amazon S3
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
Paso 2: cree una tabla
Utilice Apache Spark o Hive para crear una nueva tabla de Hive que contenga los datos cargados en Amazon S3.
Paso 3: copie los datos a DynamoDB
Utilice Spark o Hive para copiar los datos a una nueva tabla de DynamoDB.
Paso 4: haga una consulta de datos de DynamoDB
Utilice Spark o Hive para consultar la tabla de DynamoDB.