Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Conexión a DynamoDB con Amazon Serverless EMR
En este tutorial, cargará un subconjunto de datos de la Junta de Nombres Geográficos de los Estados Unidos
Paso 1: Cargar datos a un bucket de Amazon S3
Para crear un depósito de Amazon S3, siga las instrucciones de la Guía del usuario de la consola de Amazon Simple Storage Service Console. Sustituya las referencias a
por el nombre del depósito recién creado. Ahora su aplicación EMR sin servidor está lista para ejecutar tareas.amzn-s3-demo-bucket
-
Descargue el archivo de datos de muestra
features.zip
con el siguiente comando.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
Extraiga el
features.txt
archivo del archivo y visualice las primeras líneas del archivo:unzip features.zip head features.txt
El resultado debería tener un aspecto similar al siguiente.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
Los campos de cada línea indican un identificador único, nombre, tipo de elemento natural, estado, latitud en grados, longitud en grados y altura en pies.
-
Cargue sus datos a Amazon S3
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
Paso 2: Crear una tabla de Hive
Utilice Apache Spark o Hive para crear una nueva tabla de Hive que contenga los datos cargados en Amazon S3.
Paso 3: Copiar datos a DynamoDB
Use Spark o Hive para copiar los datos a una nueva tabla de DynamoDB.
Paso 4: Consulta de datos de DynamoDB
Utilice Spark o Hive para consultar la tabla de DynamoDB.