View a markdown version of this page

Tutorial: Carregamento de dados no Amazon Keyspaces usando o DSBulk - Amazon Keyspaces (para Apache Cassandra)

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Tutorial: Carregamento de dados no Amazon Keyspaces usando o DSBulk

Este tutorial passo a passo orienta você na migração de dados do Apache Cassandra para o Amazon Keyspaces DataStax usando o Bulk Loader (DSBulk) disponível em. GitHub O uso do DSBulk é útil para fazer upload de conjuntos de dados no Amazon Keyspaces para fins acadêmicos ou de teste. Para obter mais informações sobre como migrar workloads de produção, consulte Processo de migração off-line: Apache Cassandra para Amazon Keyspaces. Neste tutorial, você concluirá as seguintes etapas.

Pré-requisitos — Configure uma AWS conta com credenciais, crie um arquivo de armazenamento confiável JKS para o certificado, configurecqlsh, baixe e instale o DSBulk e configure um arquivo. application.conf

  1. Crie CSV de origem e tabela de destino: prepare um arquivo CSV como dados de origem e crie o keyspace e a tabela de destino no Amazon Keyspaces.

  2. Prepare os dados: randomize os dados no arquivo CSV e analise-os para determinar os tamanhos médio e máximo das linhas.

  3. Defina a capacidade de throughput: calcule as unidades de capacidade de gravação (WCUs) necessárias com base no tamanho dos dados e no tempo de carregamento desejado, e configure a capacidade provisionada da tabela.

  4. Definir configurações do DSBulk — Crie um arquivo de configuração do DSBulk com configurações como autenticação SSL/TLS, nível de consistência e tamanho do pool de conexão.

  5. Execute o comando DSBulk load: execute o comando DSBulk load para carregar os dados do arquivo CSV para a tabela Amazon Keyspaces e monitorar o progresso.