Tutorial: Intégrelo con Apache Spark para importar o exportar datos

Apache Spark es un motor de código abierto para el análisis de datos a gran escala. Apache Spark le permite realizar análisis de datos almacenados en Amazon Keyspaces de forma más eficiente. También puede utilizar Amazon Keyspaces para proporcionar a las aplicaciones acceso de lectura coherente en un dígito de milisegundo a los datos analíticos de Spark. El Spark Cassandra Connector de código abierto simplifica la lectura y escritura de datos entre Amazon Keyspaces y Spark.

La compatibilidad de Amazon Keyspaces con el conector Cassandra de Spark agiliza la ejecución de las cargas de trabajo de Cassandra en las canalizaciones de Spark-based análisis mediante un servicio de base de datos totalmente gestionado y sin servidor. Con Amazon Keyspaces, no tiene que preocuparse de que Spark compita por los mismos recursos de infraestructura subyacentes que sus tablas. Las tablas de Amazon Keyspaces se amplían y reducen automáticamente en función del tráfico de su aplicación.

En el siguiente tutorial se describen los pasos y las prácticas recomendadas necesarios para leer y escribir datos en Amazon Keyspaces utilizando Spark Cassandra Connector. En el tutorial se explica cómo migrar datos a Amazon Keyspaces cargando datos desde un archivo con Spark Cassandra Connector y escribiéndolos en una tabla de Amazon Keyspaces. Además, en el tutorial se muestra cómo volver a leer los datos desde Amazon Keyspaces utilizando Spark Cassandra Connector. Lo haría para ejecutar las cargas de trabajo de Cassandra en canalizaciones de análisis. Spark-based

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Paso 7: (opcional) sanear

Requisitos previos