Etapa 1: Crie o CSV arquivo de origem e uma tabela de destino para o upload de dados usando DSBulk - Amazon Keyspaces (para Apache Cassandra)

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Etapa 1: Crie o CSV arquivo de origem e uma tabela de destino para o upload de dados usando DSBulk

Neste tutorial, usamos um arquivo de valores separados por vírgula (CSV) com o nome keyspaces_sample_table.csv como arquivo de origem para a migração de dados. O arquivo de amostra fornecido contém algumas linhas de dados de uma tabela com o nome book_awards.

  1. Criar o arquivo de origem. Você pode escolher uma das seguintes opções:

    • Faça o download do CSV arquivo de amostra (keyspaces_sample_table.csv) contido no seguinte arquivo samplemigration.zip. Descompacte o arquivo e anote o caminho até keyspaces_sample_table.csv.

    • Para preencher um CSV arquivo com seus próprios dados armazenados em um banco de dados Apache Cassandra, você pode preencher o CSV arquivo de origem usando dsbulk unload conforme mostrado no exemplo a seguir.

      dsbulk unload -k mykeyspace -t mytable -f ./my_application.conf > keyspaces_sample_table.csv

      Certifique-se de que o CSV arquivo criado atenda aos seguintes requisitos:

      • A primeira linha contém os nomes das colunas.

      • Os nomes das colunas no CSV arquivo de origem correspondem aos nomes das colunas na tabela de destino.

      • Os dados são delimitados por uma vírgula.

      • Todos os valores de dados são tipos de dados válidos do Amazon Keyspaces. Consulte Tipos de dados.

  2. Criar o espaço de chaves e a tabela de destino no Amazon Keyspaces.

    1. Conecte-se ao Amazon Keyspaces usando cqlsh e substituindo o endpoint do serviço, o nome de usuário e a senha no exemplo a seguir por seus próprios valores.

      cqlsh cassandra.us-east-2.amazonaws.com 9142 -u "111122223333" -p "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY" --ssl
    2. Crie um novo espaço de chave com o nome catalog mostrado no exemplo a seguir.

      CREATE KEYSPACE catalog WITH REPLICATION = {'class': 'SingleRegionStrategy'};
    3. Depois que o novo keyspace tiver o status de disponível, use o código a seguir para criar a tabela book_awards de destino. Para saber mais sobre a criação assíncrona de recursos e como verificar se um recurso está disponível, consulte Verifique o status de criação do keyspace no Amazon Keyspaces.

      CREATE TABLE catalog.book_awards ( year int, award text, rank int, category text, book_title text, author text, publisher text, PRIMARY KEY ((year, award), category, rank) );

    Se o Apache Cassandra for sua fonte de dados original, uma maneira simples de criar a tabela de destino do Amazon Keyspaces com cabeçalhos correspondentes é gerar a declaração CREATE TABLE a partir da tabela de origem, conforme mostrado na declaração a seguir.

    cqlsh localhost 9042 -u "username" -p "password" --execute "DESCRIBE TABLE mykeyspace.mytable;"

    Em seguida, crie a tabela de destino no Amazon Keyspaces com os nomes das colunas e os tipos de dados correspondentes à descrição da tabela de origem do Cassandra.