

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Uso de una solución de migración híbrida: de Apache Cassandra a Amazon Keyspaces
<a name="migrating-hybrid"></a>

La siguiente solución de migración puede considerarse un híbrido entre la migración en línea y la migración sin conexión. Con este enfoque híbrido, se escriben los datos en la base de datos de destino casi en tiempo real sin proporcionar coherencia de lectura tras la escritura. Esto significa que los datos recién escritos no estarán disponibles de forma inmediata y que es previsible que se produzcan retrasos. Si necesita coherencia de lectura tras la escritura, consulte [Migración online a Amazon Keyspaces: estrategias y prácticas recomendadas](migrating-online.md). 

Para realizar una migración casi en tiempo real de Apache Cassandra a Amazon Keyspaces, puede elegir entre dos métodos disponibles.
+ **CQLReplicator**— (Recomendado) CQLReplicator es una utilidad de código abierto disponible en [Github](https://github.com/aws-samples/cql-replicator) que le ayuda a migrar datos de Apache Cassandra a Amazon Keyspaces casi en tiempo real.

  Para determinar las escrituras y actualizaciones que se van a propagar a la base de datos de destino, CQLReplicator escanea el rango de tokens de Apache Cassandra y utiliza un AWS Glue trabajo para eliminar los eventos duplicados y aplicar las escrituras y actualizaciones directamente a Amazon Keyspaces.
+ **Captura de datos de cambios (CDC)**: si conoce la CDC de Cassandra, otra opción para implementar una migración híbrida es utilizar la característica de CDC integrada en Apache Cassandra, que permite capturar los cambios copiando el registro de confirmaciones en un directorio de CDC independiente.

  Para ello, puede replicar los cambios en los datos en Amazon Keyspaces, lo que convierte a la CDC en una opción alternativa para los escenarios de migración de datos. 

Si no necesita coherencia de lectura tras escritura, puede utilizar la canalización CQLReplicator o una canalización de CDC para migrar los datos de Apache Cassandra a Amazon Keyspaces en función de sus preferencias y de su familiaridad con las herramientas utilizadas en cada Servicios de AWS solución. El uso de estos métodos para migrar datos prácticamente en tiempo real puede considerarse un enfoque de migración híbrido que ofrece una alternativa a la migración en línea.

Esta estrategia se considera un enfoque híbrido porque, además de las opciones descritas en este tema, deben implementarse algunos pasos del proceso de migración en línea, por ejemplo, la copia de los datos históricos y las estrategias de migración de aplicaciones que se analizan en el tema [migración en línea](migrating-online.md). 

En las siguientes secciones, se explican las opciones de migración híbrida con más detalle.

**Topics**
+ [Migre los datos mediante CQLReplicator](migration-hybrid-cql-rep.md)
+ [Migración de datos mediante la captura de datos de cambios (CDC)](migration-hybrid-cdc.md)

# Migre los datos mediante CQLReplicator
<a name="migration-hybrid-cql-rep"></a>

Con él [CQLReplicator](https://github.com/aws-samples/cql-replicator), puede leer los datos de Apache Cassandra prácticamente en tiempo real escaneando de forma inteligente el anillo de fichas de Cassandra mediante consultas CQL. CQLReplicator no usa Cassandra CDC y, en su lugar, implementa una estrategia de almacenamiento en caché para reducir las penalizaciones de rendimiento de los escaneos completos. 

Para reducir el número de escrituras en el destino, elimina CQLReplicator automáticamente los eventos de replicación duplicados. Con CQLReplicator, puede ajustar la replicación de los cambios de la base de datos de origen a la base de datos de destino, lo que permite una migración de datos casi en tiempo real de Apache Cassandra a Amazon Keyspaces. 

El siguiente diagrama muestra la arquitectura típica de un CQLReplicator trabajo que utiliza. AWS Glue 

1. **Para permitir el acceso a Apache Cassandra que se ejecuta en una VPC privada, configure AWS Glue una conexión con el tipo de conexión Red.**

1. Para eliminar los duplicados y habilitar el almacenamiento en caché de claves con la CQLReplicator tarea, configure Amazon Simple Storage Service (Amazon S3).

1. La base de datos fuente verificada de CQLReplicator Job Streams cambia directamente a Amazon Keyspaces.

![\[Se utiliza CQLReplicator para migrar datos de Apache Cassandra a Amazon Keyspaces.\]](http://docs.aws.amazon.com/es_es/keyspaces/latest/devguide/images/migration/hybrid-migration-CQLRep.png)


Para obtener más información sobre el proceso de migración mediante CQLReplicator, consulte la siguiente publicación en el blog de AWS bases de datos [Migre las cargas de trabajo de Cassandra a Amazon Keyspaces utilizando CQLReplicator](https://aws.amazon.com/blogs/database/migrate-cassandra-workloads-to-amazon-keyspaces-using-cqlreplicator/) y la guía AWS prescriptiva [Migre las cargas de trabajo de Apache Cassandra a](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/migrate-apache-cassandra-workloads-to-amazon-keyspaces-using-aws-glue.html) Amazon Keyspaces mediante el uso. AWS Glue

# Migración de datos mediante la captura de datos de cambios (CDC)
<a name="migration-hybrid-cdc"></a>

Si ya está familiarizado con la configuración de un proceso de captura de datos de cambios (CDC) con [Debezium](https://debezium.io/), puede usar esta opción para migrar datos a Amazon Keyspaces como alternativa a la de usarla. CQLReplicator Debezium es una plataforma distribuida de código abierto para la CDC, diseñada para supervisar una base de datos y capturar los cambios en las filas de manera fiable. 

El [conector de Debezium para Apache Cassandra](https://debezium.io/documentation/reference/stable/connectors/cassandra.html) carga los cambios en Amazon Managed Streaming para Apache Kafka (Amazon MSK) de modo que los consumidores intermedios puedan consumirlos, procesarlos y escribir a su vez los datos en Amazon Keyspaces. Para obtener más información, consulte [Guidance for continuous data migration from Apache Cassandra to Amazon Keyspaces](https://aws.amazon.com/solutions/guidance/continuous-data-migration-from-apache-cassandra-to-amazon-keyspaces/).

Si quiere solucionar cualquier posible problema de coherencia de datos, puede implementar un proceso con Amazon MSK en el que un consumidor compare las claves o particiones de Cassandra con las de Amazon Keyspaces.

Para implementar esta solución correctamente, le recomendamos que tenga en cuenta lo siguiente. 
+ Cómo analizar el registro de confirmaciones de la CDC; por ejemplo, cómo eliminar los eventos duplicados.
+ Cómo mantener el directorio de la CDC; por ejemplo, cómo eliminar los registros antiguos.
+ Cómo administrar los errores parciales en Apache Cassandra; por ejemplo, si una escritura solo se realiza correctamente en una de cada tres réplicas.
+ Cómo administrar la asignación de recursos, por ejemplo, aumentar el tamaño de la instancia para que admita los requisitos adicionales de CPU, memoria, disco y E/S para el proceso de CDC que se produce en un nodo.

Este patrón trata los cambios de Cassandra como “indicios” de que una clave puede haber cambiado con respecto a su estado anterior. Para determinar si hay cambios que propagar a la base de datos de destino, primero debe leer el clúster de Cassandra de origen mediante una operación `LOCAL_QUORUM` para recibir los registros más recientes y, a continuación, escribirlos en Amazon Keyspaces. 

En el caso de eliminaciones o actualizaciones de rangos, es posible que deba realizar una comparación con la totalidad de la partición para determinar qué eventos de escritura o actualización deben escribirse en la base de datos de destino. 

En los casos en que las escrituras no tengan idempotencia, también debe compararlas con lo que ya está en la base de datos de destino antes de que se efectúen en Amazon Keyspaces.

En el siguiente diagrama, se muestra la arquitectura típica de una canalización de CDC con Debezium y Amazon MSK. 

![\[Uso de una canalización de captura de datos de cambios para migrar datos de Apache Cassandra a Amazon Keyspaces.\]](http://docs.aws.amazon.com/es_es/keyspaces/latest/devguide/images/migration/hybrid-migration-CDC.png)
