Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Migre dados usando a captura de dados de alteração () CDC

Modo de foco
Migre dados usando a captura de dados de alteração () CDC - Amazon Keyspaces (para Apache Cassandra)

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Se você já está familiarizado com a configuração de um pipeline de captura de dados de alteração (CDC) com o Debezium, você pode usar essa opção para migrar dados para o Amazon Keyspaces como alternativa ao uso. CQLReplicator O Debezium é uma plataforma distribuída de código aberto projetada para CDC monitorar um banco de dados e capturar mudanças em nível de linha de forma confiável.

O conector Debezium para Apache Cassandra carrega as alterações no Amazon Managed Streaming for Apache Kafka (MSKAmazon) para que elas possam ser consumidas e processadas por consumidores downstream que, por sua vez, gravam os dados no Amazon Keyspaces. Para obter mais informações, consulte a orientação para a migração contínua de dados do Apache Cassandra para o Amazon Keyspaces.

Para resolver possíveis problemas de consistência de dados, você pode implementar um processo com a Amazon em MSK que um consumidor compara as chaves ou partições no Cassandra com as do Amazon Keyspaces.

Para implementar essa solução com sucesso, recomendamos considerar o seguinte.

  • Como analisar o registro de CDC confirmação, por exemplo, como remover eventos duplicados.

  • Como manter o CDC diretório, por exemplo, como excluir registros antigos.

  • Como lidar com falhas parciais no Apache Cassandra, por exemplo, se uma gravação só for bem-sucedida em uma das três réplicas.

  • Como lidar com a alocação de recursos, por exemplo, aumentando o tamanho da instância para considerar os requisitos adicionaisCPU, de memória e de E/S para o CDC processo que ocorre em um nó. DISK

Esse padrão trata as mudanças do Cassandra como uma “dica” de que uma chave pode ter mudado em relação ao seu estado anterior. Para determinar se há alterações a serem propagadas para o banco de dados de destino, você deve primeiro ler do cluster Cassandra de origem usando uma operação de LOCAL_QUORUM para receber os registros mais recentes e depois gravá-los no Amazon Keyspaces.

No caso de exclusões ou atualizações de intervalos, talvez seja necessário realizar uma comparação com a partição inteira para determinar quais eventos de gravação ou atualização precisam ser gravados no banco de dados de destino.

Nos casos em que as gravações não são idempotentes, você também precisa comparar suas gravações com o que já está no banco de dados de destino antes de gravar no Amazon Keyspaces.

O diagrama a seguir mostra a arquitetura típica de um CDC pipeline usando Debezium e Amazon. MSK

Usando um pipeline de captura de dados de alteração para migrar dados do Apache Cassandra para o Amazon Keyspaces.
PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.