Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Processo de migração off-line: Apache Cassandra para Amazon Keyspaces

Modo de foco
Processo de migração off-line: Apache Cassandra para Amazon Keyspaces - Amazon Keyspaces (para Apache Cassandra)

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As migrações off-line são adequadas para quando é possível permitir tempo de inatividade para realizar a migração. É comum entre as empresas ter janelas de manutenção para patches, grandes lançamentos ou tempo de inatividade para atualizações de hardware ou atualizações importantes. A migração off-line pode usar essa janela para copiar dados e transferir o tráfego do aplicativo do Apache Cassandra para o Amazon Keyspaces.

A migração off-line reduz as modificações no aplicativo porque não exige comunicação simultânea com o Cassandra e o Amazon Keyspaces. Além disso, com o fluxo de dados pausado, o estado exato pode ser copiado sem manter as mutações.

Neste exemplo, usamos o Amazon Simple Storage Service (Amazon S3) como uma área de preparação de dados durante a migração off-line para minimizar o tempo de inatividade. Você pode importar automaticamente os dados armazenados no formato Parquet no Amazon S3 em uma tabela do Amazon Keyspaces usando o conector Spark Cassandra e AWS Glue. Veja a seção a seguir uma visão geral de alto nível do processo. Você pode encontrar exemplos de código para esse processo no Github.

O processo de migração offline do Apache Cassandra para o Amazon Keyspaces usando o Amazon S3 e AWS Glue requer os seguintes trabalhos de AWS Glue.

  1. Um trabalho de ETL que extrai e transforma dados de CQL e os armazena em um bucket do Amazon S3.

  2. Um segundo trabalho que importa os dados do bucket para o Amazon Keyspaces.

  3. Um terceiro trabalho para importar dados incrementais.

Como realizar uma migração off-line do Cassandra para o Amazon Keyspaces em execução no Amazon EC2 em uma Amazon Virtual Private Cloud
  1. Primeiro, você pode usar AWS Glue para exportar dados de tabela do Cassandra no formato Parquet e salvá-los em um bucket do Amazon S3. Você precisa executar um trabalho de AWS Glue usando um conector AWS Glue para uma VPC onde reside a instância do Amazon EC2 que executa o Cassandra. Em seguida, usando o endpoint privado do Amazon S3, você pode salvar dados no bucket do Amazon S3.

    O diagrama a seguir ilustra essas etapas:

    Migração de dados do Apache Cassandra do Amazon EC2 em execução em uma VPC para um bucket do Amazon S3 usando AWS Glue.
  2. Embaralhe os dados no bucket do Amazon S3 para melhorar a randomização de dados. Dados importados uniformemente permitem um tráfego mais distribuído na tabela de destino.

    Essa etapa é necessária ao exportar dados do Cassandra com partições grandes (partições com mais de 1000 linhas) para evitar padrões de teclas de atalho ao inserir os dados no Amazon Keyspaces. Problemas com teclas de atalho causam WriteThrottleEvents no Amazon Keyspaces e resultam em maior tempo de carregamento.

    Um trabalho de AWS Glue embaralha os dados de um bucket do Amazon S3 e os retorna para outro bucket do Amazon S3.
  3. Use outro trabalho de AWS Glue para exportar dados do bucket do Amazon S3 para o Amazon Keyspaces. Os dados embaralhados no bucket do Amazon S3 são armazenados no formato Parquet.

    O trabalho de importação de AWS Glue pega dados embaralhados do bucket do Amazon S3 e os move para uma tabela do Amazon Keyspaces.

Para obter mais informações sobre o processo de migração off-line, consulte o workshop do Amazon Keyspaces com AWS Glue

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.