本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 Spark 結構化串流 Amazon Kinesis Data Streams 連接器
Amazon 7.1.0 版及更新EMR版本包含 版本映像中的 Spark 結構化串流 Amazon Kinesis Data Streams 連接器。透過此連接器,您可以使用 Amazon 上的 Spark EMR 來處理存放在 Amazon Kinesis Data Streams 中的資料。連接器支援 GetRecords
(共用輸送量) 和 SubscribeToShard
(增強的扇出) 的取用者類型。此整合是以 為基礎 spark-sql-kinesis-connector
下列範例示範如何使用連接器來啟動 Amazon 的 Spark 應用程式 EMR
spark-submit
my_kinesis_streaming_script.py