Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Connessione a DynamoDB con Amazon Serverless EMR
In questo tutorial, carichi un sottoinsieme di dati dallo United States Board on Geographic Names
Fase 1: caricare i dati in un bucket Amazon S3
Per creare un bucket Amazon S3, segui le istruzioni in Creazione di un bucket nella Guida per l'utente della console di Amazon Simple Storage Service. Sostituisci i riferimenti a
con il nome del bucket appena creato. Ora la tua applicazione EMR Serverless è pronta per eseguire i lavori.amzn-s3-demo-bucket
-
Scarica l'archivio di dati di esempio
features.zip
con il seguente comando.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
Estrai il
features.txt
file dall'archivio e visualizza le prime poche righe del file:unzip features.zip head features.txt
Il risultato dovrebbe essere simile al seguente.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
I campi in ogni riga qui indicano un identificatore univoco, un nome, un tipo di elemento naturale, lo stato, la latitudine in gradi, la longitudine in gradi e l'altezza in piedi.
-
Carica i tuoi dati su Amazon S3
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
Fase 2: Creare una tabella Hive
Usa Apache Spark o Hive per creare una nuova tabella Hive che contenga i dati caricati in Amazon S3.
Fase 3: Copiare i dati su DynamoDB
Usa Spark o Hive per copiare i dati in una nuova tabella DynamoDB.
Fase 4: Interrogare i dati da DynamoDB
Usa Spark o Hive per interrogare la tua tabella DynamoDB.