Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Connexion à DynamoDB avec Amazon Serverless EMR
Dans ce didacticiel, vous chargez un sous-ensemble de données du United States Board on Geographic Names
Étape 1 : télécharger des données dans un compartiment Amazon S3
Pour créer un compartiment Amazon S3, suivez les instructions de la section Création d'un compartiment dans le guide de l'utilisateur de la console Amazon Simple Storage Service. Remplacez les références
à par le nom du bucket que vous venez de créer. Votre application EMR Serverless est maintenant prête à exécuter des tâches.amzn-s3-demo-bucket
-
Téléchargez l'exemple d'archive de données
features.zip
à l'aide de la commande suivante.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
Extrayez le
features.txt
fichier de l'archive et visualisez les premières lignes du fichier :unzip features.zip head features.txt
Le résultat devrait ressembler à ce qui suit.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
Les champs de chaque ligne indiquent un identifiant unique, un nom, un type d'élément naturel, un état, une latitude en degrés, une longitude en degrés et une hauteur en pieds.
-
Chargez vos données sur Amazon S3
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
Étape 2 : Création d'une table Hive
Utilisez Apache Spark ou Hive pour créer une nouvelle table Hive contenant les données téléchargées dans Amazon S3.
Étape 3 : Copier les données dans DynamoDB
Utilisez Spark ou Hive pour copier des données dans une nouvelle table DynamoDB.
Étape 4 : demander des données à partir de DynamoDB
Utilisez Spark ou Hive pour interroger votre table DynamoDB.