本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Apache Spark
Apache Spark 是用于大规模数据处理的统一分析引擎。它提供了 Java、Scala、Python 和 R 的高级APIs版本,以及支持一般执行图的优化引擎。您可以使用 Apache Spark 来构建流处理应用程序,这些应用程序使用您的 Kinesis 数据流中的数据。
要使用 Apache Spark 结构化流来使用 Kinesis 数据流,请使用 Amazon Kinesis Data Streams 连接器。
要使用 Spark Streaming 使用 Kinesis 数据流,请参阅 Spark Streaming + Kinesis