View a markdown version of this page

Tutorial: Intégrelo con Apache Spark para importar o exportar datos - Amazon Keyspaces (para Apache Cassandra)

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tutorial: Intégrelo con Apache Spark para importar o exportar datos

Apache Spark es un motor de código abierto para el análisis de datos a gran escala. Apache Spark le permite realizar análisis de datos almacenados en Amazon Keyspaces de forma más eficiente. También puede utilizar Amazon Keyspaces para proporcionar a las aplicaciones acceso de lectura coherente en un dígito de milisegundo a los datos analíticos de Spark. El Spark Cassandra Connector de código abierto simplifica la lectura y escritura de datos entre Amazon Keyspaces y Spark.

La compatibilidad de Amazon Keyspaces con el conector Cassandra de Spark agiliza la ejecución de las cargas de trabajo de Cassandra en las canalizaciones de Spark-based análisis mediante un servicio de base de datos totalmente gestionado y sin servidor. Con Amazon Keyspaces, no tiene que preocuparse de que Spark compita por los mismos recursos de infraestructura subyacentes que sus tablas. Las tablas de Amazon Keyspaces se amplían y reducen automáticamente en función del tráfico de su aplicación.

En el siguiente tutorial se describen los pasos y las prácticas recomendadas necesarios para leer y escribir datos en Amazon Keyspaces utilizando Spark Cassandra Connector. En el tutorial se explica cómo migrar datos a Amazon Keyspaces cargando datos desde un archivo con Spark Cassandra Connector y escribiéndolos en una tabla de Amazon Keyspaces. Además, en el tutorial se muestra cómo volver a leer los datos desde Amazon Keyspaces utilizando Spark Cassandra Connector. Lo haría para ejecutar las cargas de trabajo de Cassandra en canalizaciones de análisis. Spark-based