Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Mit Amazon Serverless eine Verbindung zu DynamoDB herstellen EMR
In diesem Tutorial laden Sie eine Teilmenge der Daten vom United States Board on Geographic Names
Schritt 1: Daten in einen Amazon S3 S3-Bucket hochladen
Um einen Amazon S3 S3-Bucket zu erstellen, folgen Sie den Anweisungen unter Bucket erstellen im Amazon Simple Storage Service Console-Benutzerhandbuch. Ersetzen Sie Verweise auf
durch den Namen Ihres neu erstellten Buckets. Jetzt ist Ihre EMR serverlose Anwendung bereit, Jobs auszuführen.amzn-s3-demo-bucket
-
Laden Sie das Beispieldatenarchiv
features.zip
mit dem folgenden Befehl herunter.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
Extrahieren Sie die
features.txt
Datei aus dem Archiv und sehen Sie sich die ersten Zeilen der Datei an:unzip features.zip head features.txt
Das Ergebnis sollte in etwa wie folgt aussehen.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
Die Felder in jeder Zeile geben hier eine eindeutige Kennung, einen Namen, die Art des natürlichen Merkmals, den Bundesstaat, den Breitengrad in Grad, den Längengrad in Grad und die Höhe in Fuß an.
-
Laden Sie Ihre Daten auf Amazon S3 hoch
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
Schritt 2: Erstellen Sie eine Hive-Tabelle
Verwenden Sie Apache Spark oder Hive, um eine neue Hive-Tabelle zu erstellen, die die hochgeladenen Daten in Amazon S3 enthält.
Schritt 3: Daten nach DynamoDB kopieren
Verwenden Sie Spark oder Hive, um Daten in eine neue DynamoDB-Tabelle zu kopieren.
Schritt 4: Daten von DynamoDB abfragen
Verwenden Sie Spark oder Hive, um Ihre DynamoDB-Tabelle abzufragen.