Tutorial: Carga de datos en Amazon Keyspaces utilizando cqlsh - Amazon Keyspaces (para Apache Cassandra)

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tutorial: Carga de datos en Amazon Keyspaces utilizando cqlsh

Este tutorial le guía por el proceso de migración de datos de Apache Cassandra a Amazon Keyspaces mediante el comando. cqlsh COPY FROM El cqlsh COPY FROM comando resulta útil para cargar de forma rápida y sencilla pequeños conjuntos de datos a Amazon Keyspaces con fines académicos o de prueba. Para obtener más información sobre cómo migrar las cargas de trabajo de producción, consulte. Proceso de migración sin conexión: Apache Cassandra a Amazon Keyspaces En este tutorial, completará los siguientes pasos:

Requisitos previos: configurar un AWS cuenta con credenciales, cree un archivo de almacén de JKS confianza para el certificado y cqlsh configúrelo para conectarse a Amazon Keyspaces.

  1. Crear tabla de origen CSV y destino: prepare un CSV archivo como datos de origen y cree el espacio de claves y la tabla de destino en Amazon Keyspaces.

  2. Prepare los datos: distribuya aleatoriamente los datos del CSV archivo y analícelos para determinar el tamaño medio y máximo de las filas.

  3. Establezca la capacidad de rendimiento: calcule las unidades de capacidad de escritura requeridas (WCUs) en función del tamaño de los datos y el tiempo de carga deseado, y configure la capacidad aprovisionada de la tabla.

  4. Configure los parámetros de cqlsh: determine los valores óptimos para cqlsh COPY FROM parámetros como INGESTRATE NUMPROCESSESMAXBATCHSIZE, y distribuya la carga de trabajo de manera CHUNKSIZE uniforme.

  5. Ejecute el cqlsh COPY FROM comando: ejecute el cqlsh COPY FROM comando para cargar los datos del CSV archivo a la tabla Amazon Keyspaces y monitorice el progreso.

Solución de problemas: resuelva problemas comunes, como las solicitudes no válidas, los errores del analizador, los errores de capacidad y los errores de cqlsh durante el proceso de carga de datos.