Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Di bagian ini, Anda dapat meninjau berbagai alat yang dapat Anda gunakan untuk mengunggah atau memigrasi data secara massal ke Amazon Keyspaces, dan mempelajari cara memilih alat yang benar berdasarkan kebutuhan Anda. Selain itu, bagian ini memberikan ikhtisar dan kasus penggunaan step-by-step tutorial yang tersedia yang menunjukkan cara mengimpor data ke Amazon Keyspaces.
Untuk meninjau strategi yang tersedia untuk memigrasikan beban kerja dari Apache Cassandra ke Amazon Keyspaces, lihat. Buat rencana migrasi untuk migrasi dari Apache Cassandra ke Amazon Keyspaces
-
Alat migrasi
Untuk migrasi besar, pertimbangkan untuk menggunakan alat extract, transform, dan load (ETL). Anda dapat menggunakannya AWS Glue untuk melakukan migrasi transformasi data dengan cepat dan efektif. Untuk informasi selengkapnya, lihat Proses migrasi offline: Apache Cassandra ke Amazon Keyspaces.
CQLReplicator— CQLReplicator adalah utilitas open source yang tersedia di Github
yang membantu Anda memigrasikan data dari Apache Cassandra ke Amazon Keyspaces dalam waktu dekat. Untuk informasi selengkapnya, lihat Migrasi data menggunakan CQLReplicator.
Untuk mempelajari selengkapnya tentang cara menggunakan Amazon Managed Streaming for Apache Kafka guna menerapkan proses migrasi online dengan penulisan ganda, lihat Panduan migrasi data berkelanjutan dari Apache Cassandra
ke Amazon Keyspaces. Untuk mempelajari cara menggunakan konektor Apache Cassandra Spark untuk menulis data ke Amazon Keyspaces, lihat. Menghubungkan ke Amazon Keyspaces dengan Apache Spark
Mulailah dengan cepat dengan memuat data ke Amazon Keyspaces dengan menggunakan
COPY FROM
perintah cqlsh. cqlsh disertakan dengan Apache Cassandra dan paling cocok untuk memuat kumpulan data kecil atau data uji. Untuk step-by-step instruksi, lihatTutorial: Memuat data ke Amazon Keyspaces menggunakan cqlsh.Anda juga dapat menggunakan DataStax Bulk Loader untuk Apache Cassandra untuk memuat data ke Amazon Keyspaces menggunakan perintah.
dsbulk
DSBulkmenyediakan kemampuan impor yang lebih kuat daripada cqlsh dan tersedia dari repositori. GitHubUntuk step-by-step instruksi, lihatTutorial: Memuat data ke Amazon Keyspaces menggunakan DSBulk.
Pertimbangan umum untuk upload data ke Amazon Keyspaces
-
Pecah unggahan data menjadi komponen yang lebih kecil.
Pertimbangkan unit migrasi berikut dan jejak potensialnya dalam hal ukuran data mentah. Mengunggah data dalam jumlah yang lebih kecil dalam satu atau beberapa fase dapat membantu menyederhanakan migrasi Anda.
Berdasarkan cluster — Migrasikan semua data Cassandra Anda sekaligus. Pendekatan ini mungkin baik-baik saja untuk kelompok yang lebih kecil.
-
Berdasarkan ruang kunci atau tabel — Pecah migrasi Anda ke dalam grup ruang kunci atau tabel. Pendekatan ini dapat membantu Anda memigrasikan data secara bertahap berdasarkan kebutuhan Anda untuk setiap beban kerja.
Berdasarkan data — Pertimbangkan untuk memigrasikan data untuk grup pengguna atau produk tertentu, untuk menurunkan ukuran data lebih banyak lagi.
-
Prioritaskan data apa yang akan diunggah terlebih dahulu berdasarkan kesederhanaan.
Pertimbangkan jika Anda memiliki data yang dapat dimigrasikan terlebih dahulu dengan lebih mudah—misalnya, data yang tidak berubah selama waktu tertentu, data dari pekerjaan batch malam hari, data yang tidak digunakan selama jam offline, atau data dari aplikasi internal.