Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menghubungkan ke DynamoDB dengan Amazon Serverless EMR
Dalam tutorial ini, Anda mengunggah subset data dari United States Board on Geographic Names
Langkah 1: Unggah data ke bucket Amazon S3
Untuk membuat bucket Amazon S3, ikuti petunjuk dalam Membuat bucket di Panduan Pengguna Amazon Simple Storage Service Console. Ganti referensi
dengan nama bucket yang baru Anda buat. Sekarang aplikasi EMR Tanpa Server Anda siap menjalankan pekerjaan.amzn-s3-demo-bucket
-
Unduh arsip data sampel
features.zip
dengan perintah berikut.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
-
Ekstrak
features.txt
file dari arsip dan lihat yang pertama beberapa baris dalam file:unzip features.zip head features.txt
Hasilnya akan terlihat mirip dengan yang berikut ini.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
Bidang di setiap baris di sini menunjukkan pengidentifikasi unik, nama, jenis fitur alami, keadaan, garis lintang dalam derajat, bujur dalam derajat, dan tinggi dalam kaki.
-
Unggah data Anda ke Amazon S3
aws s3 cp features.txt s3://
amzn-s3-demo-bucket
/features/
Langkah 2: Buat tabel Hive
Gunakan Apache Spark atau Hive untuk membuat tabel Hive baru yang berisi data yang diunggah di Amazon S3.
Langkah 3: Salin data ke DynamoDB
Gunakan Spark atau Hive untuk menyalin data ke tabel DynamoDB baru.
Langkah 4: Kueri data dari DynamoDB
Gunakan Spark atau Hive untuk menanyakan tabel DynamoDB Anda.