

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Usando uma solução de migração híbrida: Apache Cassandra para Amazon Keyspaces
<a name="migrating-hybrid"></a>

A solução de migração a seguir pode ser considerada um híbrido entre migração on-line e off-line. Com essa abordagem híbrida, os dados são gravados no banco de dados de destino quase em tempo real, sem fornecer consistência de leitura após gravação. Isso significa que os dados recém-gravados não estarão imediatamente disponíveis e que atrasos são esperados. Se você precisar de consistência de leitura após gravação, consulte [Migração on-line para o Amazon Keyspaces: estratégias e melhores práticas](migrating-online.md). 

Para uma migração quase em tempo real do Apache Cassandra para o Amazon Keyspaces, você pode escolher entre dois métodos disponíveis.
+ **CQLReplicator**— (Recomendado) CQLReplicator é um utilitário de código aberto disponível no [Github](https://github.com/aws-samples/cql-replicator) que ajuda você a migrar dados do Apache Cassandra para o Amazon Keyspaces quase em tempo real.

  Para determinar as gravações e atualizações a serem propagadas para o banco de dados de destino, CQLReplicator escaneia o intervalo de tokens do Apache Cassandra e usa um AWS Glue trabalho para remover eventos duplicados e aplicar gravações e atualizações diretamente no Amazon Keyspaces.
+ **Captura de dados de alterações (CDC)**: se você estiver familiarizado com o Cassandra CDC, o recurso CDC integrado do Apache Cassandra, que permite capturar alterações copiando o log de confirmação em um diretório CDC separado, é outra opção para implementar uma migração híbrida.

  Você pode fazer isso replicando as alterações de dados no Amazon Keyspaces, tornando o CDC uma opção alternativa para cenários de migração de dados. 

Se você não precisar de consistência de leitura após gravação, você pode usar o pipeline CQLReplicator ou o CDC para migrar dados do Apache Cassandra para o Amazon Keyspaces com base em suas preferências e familiaridade com as ferramentas usadas em cada solução. Serviços da AWS Usar esses métodos para migrar dados quase em tempo real pode ser considerado uma abordagem híbrida de migração que oferece uma alternativa à migração on-line.

Essa estratégia é considerada uma abordagem híbrida porque, além das opções descritas neste tópico, você precisa implementar algumas etapas do progresso da migração on-line, por exemplo, a cópia histórica dos dados e as estratégias de migração de aplicativos discutidas no tópico de [migração on-line](migrating-online.md). 

As seções a seguir detalham mais as opções de migração híbrida.

**Topics**
+ [Migre dados usando CQLReplicator](migration-hybrid-cql-rep.md)
+ [Migre dados usando a captura de dados de alteração (CDC)](migration-hybrid-cdc.md)

# Migre dados usando CQLReplicator
<a name="migration-hybrid-cql-rep"></a>

Com [CQLReplicator](https://github.com/aws-samples/cql-replicator), você pode ler dados do Apache Cassandra quase em tempo real por meio da digitalização inteligente do token ring do Cassandra usando consultas CQL. CQLReplicator não usa o Cassandra CDC e, em vez disso, implementa uma estratégia de armazenamento em cache para reduzir as penalidades de desempenho de escaneamentos completos. 

Para reduzir o número de gravações no destino, remove CQLReplicator automaticamente os eventos de replicação duplicados. Com isso CQLReplicator, você pode ajustar a replicação de alterações do banco de dados de origem para o banco de dados de destino, permitindo uma migração quase em tempo real dos dados do Apache Cassandra para o Amazon Keyspaces. 

O diagrama a seguir mostra a arquitetura típica de um CQLReplicator trabalho usandoAWS Glue. 

1. **Para permitir o acesso ao Apache Cassandra em execução em uma VPC privada, configure uma AWS Glue conexão com o tipo de conexão Rede.**

1. Para remover duplicatas e ativar o armazenamento em cache de chaves com o CQLReplicator trabalho, configure o Amazon Simple Storage Service (Amazon S3).

1. O banco de dados de origem verificado do fluxo de CQLReplicator trabalho muda diretamente para o Amazon Keyspaces.

![\[Usando CQLReplicator para migrar dados do Apache Cassandra para o Amazon Keyspaces.\]](http://docs.aws.amazon.com/pt_br/keyspaces/latest/devguide/images/migration/hybrid-migration-CQLRep.png)


Para obter mais informações sobre o uso do processo de migração CQLReplicator, consulte a postagem a seguir no blog de AWS banco de dados [Migrar cargas de trabalho do Cassandra para o Amazon Keyspaces CQLReplicator usando e a orientação prescritiva Migrar cargas](https://aws.amazon.com/blogs/database/migrate-cassandra-workloads-to-amazon-keyspaces-using-cqlreplicator/) [de trabalho AWS do Apache](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/migrate-apache-cassandra-workloads-to-amazon-keyspaces-using-aws-glue.html) Cassandra para o Amazon Keyspaces usando. AWS Glue

# Migre dados usando a captura de dados de alteração (CDC)
<a name="migration-hybrid-cdc"></a>

Se você já está familiarizado com a configuração de um pipeline de captura de dados de alteração (CDC) com o [Debezium](https://debezium.io/), você pode usar essa opção para migrar dados para o Amazon Keyspaces como alternativa ao uso. CQLReplicator O Debezium é uma plataforma distribuída de código aberto para CDC, projetada para monitorar um banco de dados e capturar mudanças em nível de linha de forma confiável. 

O [conector Debezium para Apache Cassandra](https://debezium.io/documentation/reference/stable/connectors/cassandra.html) carrega as alterações no Amazon Managed Streaming for Apache Kafka (Amazon MSK) para que elas possam ser consumidas e processadas por consumidores downstream que, por sua vez, gravam os dados no Amazon Keyspaces. Para obter mais informações, consulte a [orientação para a migração contínua de dados do Apache Cassandra para o Amazon Keyspaces](https://aws.amazon.com/solutions/guidance/continuous-data-migration-from-apache-cassandra-to-amazon-keyspaces/).

Para resolver quaisquer possíveis problemas de consistência de dados, você pode implementar um processo com o Amazon MSK em que um consumidor compara as chaves ou partições no Cassandra com as do Amazon Keyspaces.

Para implementar essa solução com sucesso, recomendamos considerar o seguinte. 
+ Como analisar o registro de confirmação do CDC, por exemplo, como remover eventos duplicados.
+ Como manter o diretório CDC, por exemplo, como excluir registros antigos.
+ Como lidar com falhas parciais no Apache Cassandra, por exemplo, se uma gravação só for bem-sucedida em uma das três réplicas.
+ Como lidar com a alocação de recursos, por exemplo, aumentando o tamanho da instância para atender aos requisitos adicionais de CPU, memória, DISCO e E/S para o processo CDC que ocorre em um nó.

Esse padrão trata as mudanças do Cassandra como uma “dica” de que uma chave pode ter mudado em relação ao seu estado anterior. Para determinar se há alterações a serem propagadas para o banco de dados de destino, você deve primeiro ler do cluster Cassandra de origem usando uma operação de `LOCAL_QUORUM` para receber os registros mais recentes e depois gravá-los no Amazon Keyspaces. 

No caso de exclusões ou atualizações de intervalos, talvez seja necessário realizar uma comparação com a partição inteira para determinar quais eventos de gravação ou atualização precisam ser gravados no banco de dados de destino. 

Nos casos em que as gravações não são idempotentes, você também precisa comparar suas gravações com o que já está no banco de dados de destino antes de gravar no Amazon Keyspaces.

O diagrama a seguir mostra a arquitetura típica de um pipeline CDC usando o Debezium e o Amazon MSK. 

![\[Usando um pipeline de captura de dados de alteração para migrar dados do Apache Cassandra para o Amazon Keyspaces.\]](http://docs.aws.amazon.com/pt_br/keyspaces/latest/devguide/images/migration/hybrid-migration-CDC.png)
