Spark 構造化ストリーミング Amazon Kinesis Data Streams コネクタの使用
Amazon EMR リリース 7.1.0 以降には、リリースイメージに Spark 構造化ストリーミング Amazon Kinesis Data Streams コネクタが含まれています。このコネクタを使用すると、Amazon EMR で Spark を使用して Amazon Kinesis Data Streams に保存されているデータを処理できます。コネクタは、コンシューマータイプ GetRecords
(共有スループット) と SubscribeToShard
(拡張ファンアウト) の両方をサポートします。この統合は
spark-sql-kinesis-connector
次の例は、コネクタを使用して Amazon EMR で Spark アプリケーションを起動する方法を示しています。
spark-submit
my_kinesis_streaming_script.py