

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Apache Spark
<a name="using-other-services-read-spark"></a>

Apache Spark 是用于大规模数据处理的统一分析引擎。它提供了 Java、Scala、Python 和 R 的高级 APIs 版本，以及支持一般执行图的优化引擎。您可以使用 Apache Spark 来构建流处理应用程序，这些应用程序使用您的 Kinesis 数据流中的数据。

要通过 Apache Spark Structured Streaming 使用 Kinesis 数据流，请使用 Amazon Kinesis Data Streams [连接器](https://github.com/awslabs/spark-sql-kinesis-connector)。此连接器支持增强扇出型使用，可为您的应用程序提供高达每分片 2 MB/s 的专用数据读取吞吐量。有关更多信息，请参阅[开发具有专用吞吐量的自定义消费端（增强型扇出功能）](https://docs.aws.amazon.com/streams/latest/dev/enhanced-consumers.html)。

要通过 Spark Streaming 使用 Kinesis Data Streams，请参阅 [Spark Streaming \+ Kinesis Integration](https://spark.apache.org/docs/latest/streaming-kinesis-integration.html)。