Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Proceso de migración sin conexión: de Apache Cassandra a Amazon Keyspaces

Modo de enfoque
Proceso de migración sin conexión: de Apache Cassandra a Amazon Keyspaces - Amazon Keyspaces (para Apache Cassandra)

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las migraciones sin conexión son adecuadas cuando se pueda permitir un tiempo de inactividad para llevarlas a cabo. Es habitual que las empresas tengan períodos de mantenimiento para la aplicación de parches o lanzamientos de gran tamaño, o tiempos de inactividad para llevar a cabo actualizaciones de hardware o cambios principales. La migración sin conexión puede aprovechar estos periodos para copiar datos y transferir el tráfico de aplicaciones de Apache Cassandra a Amazon Keyspaces.

La migración sin conexión reduce las modificaciones en la aplicación porque no requiere la comunicación simultánea con Cassandra y Amazon Keyspaces. Además, dado que el flujo de datos está pausado, se puede copiar el estado exacto sin mantener las mutaciones.

En este ejemplo, utilizamos Amazon Simple Storage Service (Amazon S3) como espacio provisional para los datos durante la migración sin conexión con el objetivo de minimizar el tiempo de inactividad. Puede importar automáticamente los datos que ha almacenado en formato Parquet en Amazon S3 a una tabla de Amazon Keyspaces mediante Spark Cassandra Connector y AWS Glue. En la siguiente sección se mostrará información general de alto nivel del proceso. Puede encontrar ejemplos de código para este proceso en Github.

El proceso de migración sin conexión de Apache Cassandra a Amazon Keyspaces mediante Amazon S3 y AWS Glue requiere los siguientes trabajos de AWS Glue.

  1. Un trabajo ETL que extraiga y transforme los datos de CQL y los almacena en un bucket de Amazon S3.

  2. Un segundo trabajo que importe los datos del bucket a Amazon Keyspaces.

  3. Un tercer trabajo que importe datos incrementales.

Cómo realizar una migración sin conexión a Amazon Keyspaces desde Cassandra cuando se ejecuta en Amazon EC2 en una Amazon Virtual Private Cloud
  1. En primer lugar, se usa AWS Glue para exportar los datos de las tablas desde Cassandra en formato Parquet y se guardan en un bucket de Amazon S3. Debe ejecutar un trabajo de AWS Glue mediante un conector de AWS Glue a una VPC en la que resida la instancia de Amazon EC2 en la que se ejecute Cassandra. A continuación, con el punto de conexión privado de Amazon S3, puede guardar los datos en el bucket de Amazon S3.

    En el siguiente diagrama se muestran estos pasos.

    Migración de datos de Apache Cassandra desde Amazon EC2 cuando se ejecuta en una VPC a un bucket de Amazon S3 mediante AWS Glue.
  2. Mezcla de los datos en el bucket de Amazon S3 para mejorar la asignación al azar de los datos. Los datos importados de manera uniforme permiten distribuir más el tráfico en la tabla de destino.

    Este paso es obligatorio cuando se exportan datos de Cassandra con particiones grandes (particiones con más de 1000 filas) para evitar patrones de claves sobrecargadas al insertar los datos en Amazon Keyspaces. Los problemas por claves sobrecargadas provocan WriteThrottleEvents en Amazon Keyspaces y causan un aumento del tiempo de carga.

    Un trabajo de AWS Glue mezcla los datos de un bucket de Amazon S3 y los devuelve a otro bucket de Amazon S3.
  3. Utilice otro trabajo de AWS Glue para exportar datos del bucket de Amazon S3 a Amazon Keyspaces. Los datos mezclados en el bucket de Amazon S3 se almacenan en formato Parquet.

    El trabajo de importación de AWS Glue toma los datos mezclados del bucket de Amazon S3 y los traslada a una tabla de Amazon Keyspaces.

Para obtener más información sobre el proceso de migración sin conexión, consulte el taller Amazon Keyspaces with AWS Glue

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.