Utilisation du connecteur Amazon Kinesis Data Streams pour le streaming structuré Spark - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation du connecteur Amazon Kinesis Data Streams pour le streaming structuré Spark

Les EMR versions 7.1.0 et supérieures d'Amazon incluent un connecteur Amazon Kinesis Data Streams de streaming structuré Spark dans l'image de publication. Avec ce connecteur, vous pouvez utiliser Spark on Amazon EMR pour traiter les données stockées dans Amazon Kinesis Data Streams. Le connecteur prend en charge à la fois les types de consommation GetRecords (débit partagé) et SubscribeToShard (ventilation améliorée). Cette intégration est basée sur le spark-sql-kinesis-connector. Pour plus de détails sur la façon de commencer à utiliser le connecteur, consultez le README.

L'exemple suivant montre comment utiliser le connecteur pour lancer une application Spark avec Amazon EMR

spark-submit my_kinesis_streaming_script.py