AWS Glue Spark et PySpark jobs - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

AWS Glue Spark et PySpark jobs

AWS Glue soutenez Spark et PySpark jobs. Une tâche Spark est exécutée dans un environnement Apache Spark géré par AWS Glue. Elle traite les données par lots. Une ETL tâche de streaming est similaire à une tâche Spark, sauf qu'elle s'exécute ETL sur des flux de données. Elle utilise le cadre Apache Spark Structured Streaming. Certaines fonctionnalités de Spark ne sont pas disponibles pour les ETL tâches de streaming.

Les sections suivantes fournissent des informations sur AWS Glue Spark et les PySpark jobs.