Como se conectar ao DynamoDB com o Amazon EMR Sem Servidor
Neste tutorial, você faz upload de um subconjunto de dados do United States Board on Geographic Names
Etapa 1: upload dos dados em um bucket do Amazon S3
Para criar um bucket do Amazon S3, siga as instruções em Criação de um bucket no Guia do usuário do console do Amazon Simple Storage Service. Substitua as referências a
pelo nome do bucket recém-criado. Agora, a aplicação do EMR Sem Servidor está pronta para executar trabalhos.amzn-s3-demo-bucket
-
Faça download do arquivo de exemplo de dados
features.zip
com o comando a seguir.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
Extraia o arquivo
features.txt
do arquivamento e exiba as primeiras linhas do arquivo:unzip features.zip head features.txt
O resultado deve ser semelhante ao mostrado a seguir.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
Os campos em cada linha aqui indicam um identificador exclusivo, nome, tipo de característica natural, estado, latitude em graus, longitude em graus e altura em pés.
-
Upload de dados no Amazon S3
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
Etapa 2: criar uma tabela do Hive
Use o Apache Spark ou o Hive para criar uma tabela do Hive que contenha os dados carregados no Amazon S3.
Etapa 3: copiar dados para o DynamoDB
Use o Spark ou o Hive para copiar dados para uma nova tabela do DynamoDB.
Etapa 4: consultar dados do DynamoDB
Use o Spark ou o Hive para consultar sua tabela do DynamoDB.