Tutorial: Como carregar dados no Amazon Keyspaces usando cqlsh - Amazon Keyspaces (para Apache Cassandra)

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Tutorial: Como carregar dados no Amazon Keyspaces usando cqlsh

Este tutorial orienta você no processe de migração de dados do Apache Cassandra para o Amazon Keyspaces usando o comando cqlsh COPY FROM. O comando cqlsh COPY FROM é útil para carregar pequenos conjuntos de dados de forma rápida e fácil no Amazon Keyspaces para fins acadêmicos ou de teste. Para obter mais informações sobre como migrar workloads de produção, consulte Processo de migração off-line: Apache Cassandra para Amazon Keyspaces. Você concluirá as seguintes etapas neste tutorial:

Pré-requisitos: configure uma conta de AWS com credenciais, crie um arquivo JKS trust store para o certificado e configure cqlsh para se conectar ao Amazon Keyspaces.

  1. Crie CSV de origem e tabela de destino: prepare um arquivo CSV como dados de origem e crie o keyspace e a tabela de destino no Amazon Keyspaces.

  2. Prepare os dados: randomize os dados no arquivo CSV e analise-os para determinar os tamanhos médio e máximo das linhas.

  3. Defina a capacidade de throughput: calcule as unidades de capacidade de gravação (WCUs) necessárias com base no tamanho dos dados e no tempo de carregamento desejado, e configure a capacidade provisionada da tabela.

  4. Configurar parâmetros cqlsh: determine os valores ideais para parâmetros decqlsh COPY FROM como INGESTRATE, NUMPROCESSES, MAXBATCHSIZE e CHUNKSIZE distribua a workload uniformemente.

  5. Execute o comando cqlsh COPY FROM: execute o comando cqlsh COPY FROM para carregar os dados do arquivo CSV para a tabela do Amazon Keyspaces e monitorar o progresso.

Solução de problemas: resolva problemas comuns, como solicitações inválidas, erros do analisador, erros de capacidade e erros de cqlsh durante o processo de upload de dados.