Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
In questa sezione puoi esaminare i diversi strumenti che puoi utilizzare per caricare in blocco o migrare dati su Amazon Keyspaces e scoprire come selezionare lo strumento corretto in base alle tue esigenze. Inoltre, questa sezione fornisce una panoramica e i casi d'uso dei step-by-step tutorial disponibili che dimostrano come importare dati in Amazon Keyspaces.
Per esaminare le strategie disponibili per migrare i carichi di lavoro da Apache Cassandra ad Amazon Keyspaces, consulta. Crea un piano di migrazione per la migrazione da Apache Cassandra ad Amazon Keyspaces
-
Strumenti di migrazione
Per migrazioni di grandi dimensioni, prendi in considerazione l'utilizzo di uno strumento di estrazione, trasformazione e caricamento (ETL). Puoi utilizzarlo AWS Glue per eseguire migrazioni di trasformazione dei dati in modo rapido ed efficace. Per ulteriori informazioni, consulta Processo di migrazione offline: da Apache Cassandra ad Amazon Keyspaces.
CQLReplicator— CQLReplicator è un'utilità open source disponibile su Github
che consente di migrare i dati da Apache Cassandra ad Amazon Keyspaces quasi in tempo reale. Per ulteriori informazioni, consulta Migra i dati utilizzando CQLReplicator.
Per ulteriori informazioni su come utilizzare Amazon Managed Streaming for Apache Kafka per implementare un processo di migrazione online con doppia scrittura, consulta la Guida per la migrazione continua dei dati da
Apache Cassandra ad Amazon Keyspaces. Per informazioni su come utilizzare il connettore Apache Cassandra Spark per scrivere dati su Amazon Keyspaces, consulta. Connessione ad Amazon Keyspaces con Apache Spark
Inizia rapidamente a caricare dati in Amazon Keyspaces utilizzando il
COPY FROM
comando cqlsh. cqlsh è incluso in Apache Cassandra ed è ideale per caricare piccoli set di dati o dati di test. step-by-stepPer istruzioni, consulta. Tutorial: Caricamento di dati in Amazon Keyspaces utilizzando cqlshPuoi anche utilizzare DataStax Bulk Loader per Apache Cassandra per caricare dati in Amazon Keyspaces utilizzando il comando.
dsbulk
DSBulkoffre funzionalità di importazione più solide rispetto a cqlsh ed è disponibile nel repository. GitHubPer step-by-step istruzioni, vedere. Tutorial: caricamento di dati in Amazon Keyspaces utilizzando DSBulk
Considerazioni generali per il caricamento di dati su Amazon Keyspaces
-
Suddividi il caricamento dei dati in componenti più piccoli.
Considerate le seguenti unità di migrazione e il loro potenziale impatto in termini di dimensioni dei dati grezzi. Il caricamento di piccole quantità di dati in una o più fasi può contribuire a semplificare la migrazione.
Per cluster: migra tutti i dati di Cassandra contemporaneamente. Questo approccio può essere utile per i cluster più piccoli.
-
Per spazio di chiavi o tabella: suddividi la migrazione in gruppi di spazi chiave o tabelle. Questo approccio può aiutarti a migrare i dati in fasi in base ai requisiti per ogni carico di lavoro.
In base ai dati: valuta la possibilità di migrare i dati per un gruppo specifico di utenti o prodotti, per ridurre ulteriormente le dimensioni dei dati.
-
Dai la priorità ai dati da caricare per primi in base alla semplicità.
Valuta se disponi di dati che potrebbero essere migrati per primi più facilmente, ad esempio dati che non cambiano in orari specifici, dati provenienti da processi in batch notturni, dati non utilizzati durante le ore offline o dati provenienti da app interne.