Tutorial: caricamento di dati in Amazon Keyspaces utilizzando DSBulk - Amazon Keyspaces (per Apache Cassandra)

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tutorial: caricamento di dati in Amazon Keyspaces utilizzando DSBulk

Questo step-by-step tutorial ti guida nella migrazione dei dati da Apache Cassandra ad Amazon Keyspaces utilizzando DataStax Bulk Loader () disponibile su. DSBulk GitHub L'utilizzo DSBulk è utile per caricare set di dati su Amazon Keyspaces per scopi accademici o di test. Per ulteriori informazioni su come migrare i carichi di lavoro di produzione, consulta. Processo di migrazione offline: da Apache Cassandra ad Amazon Keyspaces In questo tutorial, completerai i seguenti passaggi.

Prerequisiti: configurare un AWS account con credenziali, creazione di un file JKS trust store per il certificato, configurazionecqlsh, downloadDSBulk, installazione e configurazione di un application.conf file.

  1. Crea tabella di origine CSV e di destinazione: prepara un CSV file come dati di origine e crea lo spazio chiave e la tabella di destinazione in Amazon Keyspaces.

  2. Preparazione dei dati: randomizza i dati nel CSV file e analizzali per determinare le dimensioni medie e massime delle righe.

  3. Imposta la capacità di trasmissione: calcola le unità di capacità di scrittura richieste (WCUs) in base alla dimensione dei dati e al tempo di caricamento desiderato e configura la capacità assegnata alla tabella.

  4. Configurazione DSBulk delle impostazioni: crea un file di DSBulk configurazione con impostazioni come autenticazione,SSL/TLS, livello di consistenza e dimensione del pool di connessioni.

  5. Esegui il comando DSBulk load: esegui il comando DSBulk load per caricare i dati dal CSV file nella tabella Amazon Keyspaces e monitorare l'avanzamento.