As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Nesta seção, você pode analisar as diferentes ferramentas que você pode usar para carregar ou migrar dados em massa para o Amazon Keyspaces e aprender como selecionar a ferramenta correta com base em suas necessidades. Além disso, esta seção fornece uma visão geral e casos de uso dos step-by-step tutoriais disponíveis que demonstram como importar dados para o Amazon Keyspaces.
Para analisar as estratégias disponíveis para migrar workloads do Apache Cassandra para o Amazon Keyspaces, consulte Crie um plano de migração para migrar do Apache Cassandra para o Amazon Keyspaces.
-
Ferramentas de migração
Para grandes migrações, considere usar uma ferramenta de extração, transformação e carregamento (ETL). Você pode usar AWS Glue para realizar migrações de transformação de dados de forma rápida e eficaz. Para obter mais informações, consulte Processo de migração off-line: Apache Cassandra para Amazon Keyspaces.
CQLReplicator— CQLReplicator é um utilitário de código aberto disponível no Github
que ajuda você a migrar dados do Apache Cassandra para o Amazon Keyspaces quase em tempo real. Para obter mais informações, consulte Migre dados usando CQLReplicator.
Para saber mais sobre como usar o Amazon Managed Streaming for Apache Kafka para implementar um processo de migração on-line com gravação dupla, consulte Guidance for continuous data migration from Apache Cassandra to Amazon Keyspaces
. Para saber como usar o conector Apache Cassandra do Spark para gravar dados no Amazon Keyspaces, consulte Conexão com Amazon Keyspaces com o Apache Spark.
Comece rapidamente a carregar dados no Amazon Keyspaces usando o comando cqlsh
COPY FROM
. O cqlsh está incluído no Apache Cassandra e é mais adequado para carregar pequenos conjuntos de dados ou dados de teste. Para step-by-step obter instruções, consulteTutorial: Como carregar dados no Amazon Keyspaces usando cqlsh.Você também pode usar o DataStax Bulk Loader for Apache Cassandra para carregar dados no Amazon Keyspaces usando o comando.
dsbulk
DSBulkfornece recursos de importação mais robustos do que o cqlsh e está disponível no GitHub repositório.Para step-by-step obter instruções, consulteTutorial: Carregamento de dados no Amazon Keyspaces usando o DSBulk.
Considerações gerais sobre uploads de dados para o Amazon Keyspaces
-
Divida o upload de dados em componentes menores.
Considere as seguintes unidades de migração e sua presença potencial em termos de tamanho de dados brutos. O upload de quantidades menores de dados em uma ou mais fases pode ajudar a simplificar sua migração.
Por cluster: migre todos os seus dados do Cassandra de uma só vez. Essa abordagem pode ser adequada para clusters menores.
-
Por espaço de chaves ou tabela: divida sua migração em grupos de espaços de chaves ou tabelas. Essa abordagem pode ajudá-lo a migrar dados em fases com base nos requisitos de cada workload.
Por dados: considere migrar dados para um grupo específico de usuários ou produtos, para reduzir ainda mais o tamanho dos dados.
-
Priorize quais dados carregar primeiro com base na simplicidade.
Considere se você tem dados que poderiam ser migrados primeiro com mais facilidade – por exemplo, dados que não mudam em horários específicos, dados de trabalhos em lotes noturnos, dados não usados em horários off-line ou dados de aplicativos internos.