As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Este tutorial passo a passo orienta você na migração de dados do Apache Cassandra para o Amazon Keyspaces usando o carregador em massa do DataStax (DSBulk) disponível no GitHub.
Pré-requisitos: configure uma conta de AWS com credenciais, crie um arquivo de armazenamento confiável JKS para o certificado, configure cqlsh
, baixe e instale o DSBulk e configure um arquivo application.conf
.
Crie CSV de origem e tabela de destino: prepare um arquivo CSV como dados de origem e crie o keyspace e a tabela de destino no Amazon Keyspaces.
Prepare os dados: randomize os dados no arquivo CSV e analise-os para determinar os tamanhos médio e máximo das linhas.
Defina a capacidade de throughput: calcule as unidades de capacidade de gravação (WCUs) necessárias com base no tamanho dos dados e no tempo de carregamento desejado, e configure a capacidade provisionada da tabela.
Definir configurações do DSBulk: crie um arquivo de configuração do DSBulk com configurações como autenticação, SSL/TLS, nível de consistência e tamanho do pool de conexão.
Execute o comando DSBulk load: execute o comando DSBulk load para carregar os dados do arquivo CSV para a tabela Amazon Keyspaces e monitorar o progresso.
Tópicos
- Pré-requisitos: Etapas que você precisa concluir antes de fazer o upload de dados com o DSBulk
- Etapa 1: Criar o arquivo CSV de origem e uma tabela de destino para o upload dos dados usando o DSBulk
- Etapa 2: Preparar os dados para fazer o upload usando o DSBulk
- Etapa 3: definir a capacidade de throughput da tabela de destino
- Etapa 4: definir as configurações de DSBulk para carregar dados do arquivo CSV para a tabela de destino
- Etapa 5: Execute o comando load de DSBulk para carregar dados do arquivo CSV para a tabela de destino