Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Apache Spark es un motor de código abierto para el análisis de datos a gran escala. Apache Spark le permite realizar análisis de datos almacenados en Amazon Keyspaces de forma más eficiente. También puede utilizar Amazon Keyspaces para proporcionar a las aplicaciones acceso de lectura coherente en un dígito de milisegundo a los datos analíticos de Spark. El Spark Cassandra Connector de código abierto simplifica la lectura y escritura de datos entre Amazon Keyspaces y Spark.
La compatibilidad de Amazon Keyspaces con Spark Cassandra Connector agiliza la ejecución de cargas de trabajo de Cassandra en canalizaciones de análisis basadas en Spark mediante el uso de un servicio de base de datos totalmente administrado sin servidor. Con Amazon Keyspaces, no tiene que preocuparse de que Spark compita por los mismos recursos de infraestructura subyacentes que sus tablas. Las tablas de Amazon Keyspaces se amplían y reducen automáticamente en función del tráfico de su aplicación.
En el siguiente tutorial se describen los pasos y las prácticas recomendadas necesarios para leer y escribir datos en Amazon Keyspaces utilizando Spark Cassandra Connector. En el tutorial se explica cómo migrar datos a Amazon Keyspaces cargando datos desde un archivo con Spark Cassandra Connector y escribiéndolos en una tabla de Amazon Keyspaces. Además, en el tutorial se muestra cómo volver a leer los datos desde Amazon Keyspaces utilizando Spark Cassandra Connector. Esto se haría para ejecutar cargas de trabajo de Cassandra en canalizaciones de análisis basadas en Spark.
Temas
- Requisitos previos para establecer conexiones a Amazon Keyspaces con Spark Cassandra Connector
- Paso 1: Configurar Amazon Keyspaces para la integración con Apache Cassandra Spark Connector
- Paso 2: Configurar Apache Cassandra Spark Connector
- Paso 3: Crear el archivo de configuración de la aplicación
- Paso 4: Preparar los datos de origen y la tabla de destino en Amazon Keyspaces
- Paso 5: Escribir y leer datos en Amazon Keyspaces utilizando Apache Cassandra Spark Connector
- Solución de problemas comunes al utilizar Spark Cassandra Connector con Amazon Keyspaces