Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
En esta sección, revisará las diferentes herramientas que puede utilizar para cargar o migrar datos por lotes a Amazon Keyspaces y aprenderá a seleccionar la herramienta correcta en función de sus necesidades. Además, en esta sección se proporciona información general y casos de uso de los step-by-step tutoriales disponibles que muestran cómo importar datos a Amazon Keyspaces.
Para revisar las estrategias disponibles para migrar cargas de trabajo de Apache Cassandra a Amazon Keyspaces, consulte Creación de un plan de migración para migrar de Apache Cassandra a Amazon Keyspaces.
-
Herramientas de migración
Para migraciones grandes, considere la posibilidad de utilizar una herramienta de extracción, transformación y carga (ETL). Puede utilizar AWS Glue para realizar migraciones de transformación de datos de forma rápida y eficaz. Para obtener más información, consulte Proceso de migración sin conexión: de Apache Cassandra a Amazon Keyspaces.
CQLReplicator— CQLReplicator es una utilidad de código abierto disponible en Github
que le ayuda a migrar datos de Apache Cassandra a Amazon Keyspaces casi en tiempo real. Para obtener más información, consulte Migre los datos mediante CQLReplicator.
Para obtener más información sobre cómo usar Amazon Managed Streaming para Apache Kafka para implementar un proceso de migración en línea con escrituras duales, consulte Guidance for continuous data migration from Apache Cassandra to Amazon Keyspaces
. Para obtener información sobre cómo utilizar el conector Apache Cassandra Spark para escribir datos en Amazon Keyspaces, consulte Conexión a Amazon Keyspaces con Apache Spark.
Comience sin demora a cargar datos en Amazon Keyspaces con el comando
COPY FROM
de cqlsh. cqlsh se incluye con Apache Cassandra y es el más adecuado para cargar pequeños conjuntos de datos o datos de prueba. Para obtener step-by-step instrucciones, consulte. Tutorial: Carga de datos en Amazon Keyspaces utilizando cqlshTambién puede usar DataStax Bulk Loader for Apache Cassandra para cargar datos en Amazon Keyspaces mediante
dsbulk
el comando. DSBulkproporciona capacidades de importación más sólidas que cqlsh y está disponible en el repositorio. GitHubPara obtener step-by-step instrucciones, consulte. Tutorial: Carga de datos en Amazon Keyspaces utilizando DSBulk
Consideraciones generales para la carga de datos a Amazon Keyspaces
-
Divida la carga de datos en componentes más pequeños.
Considere las siguientes unidades de migración y su huella potencial en términos de tamaño de datos en bruto. Cargar cantidades más pequeñas de datos en una o varias fases puede ayudar a simplificar su migración.
Por clúster: migre todos sus datos de Cassandra a la vez. Este enfoque podría ser adecuado para clústeres pequeños.
-
Por espacio de claves o tabla: divida su migración en grupos de espacios de claves o tablas. Este enfoque puede ayudarle a migrar los datos por fases en función de sus necesidades para cada carga de trabajo.
Por datos: considere la posibilidad de migrar los datos de un grupo específico de usuarios o productos, para reducir aún más el tamaño de los datos.
-
Priorice qué datos cargar primero en función de la simplicidad.
Considere si tiene datos que podrían migrarse primero con más facilidad; por ejemplo, datos que no cambien durante horas específicas, datos de trabajos por lotes nocturnos, datos que no se utilicen durante horas sin conexión o datos de aplicaciones internas.