Activités - AWS Data Pipeline

AWS Data Pipeline n'est plus disponible pour les nouveaux clients. Les clients existants de AWS Data Pipeline peuvent continuer à utiliser le service normalement. En savoir plus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Activités

Dans AWS Data Pipeline, une activité est un composant du pipeline qui définit le travail à effectuer. AWS Data Pipeline propose plusieurs activités prédéfinies adaptées à des scénarios courants, tels que le déplacement de données d'un emplacement à un autre, l'exécution de requêtes Hive, etc. Les activités étant extensibles, vous pouvez exécuter vos propres scripts personnalisés pour prendre en charge une multitude de combinaisons.

AWS Data Pipeline prend en charge les types d'activités suivants :

CopyActivity

Copie les données d'un emplacement vers un autre.

EmrActivity

Exécute un cluster Amazon EMR.

HiveActivity

Exécute une requête Hive sur un cluster Amazon EMR.

HiveCopyActivity

Exécute une requête Hive sur un cluster Amazon EMR avec prise en charge du filtrage avancé des données et prise en charge S3 DataNode de et. ynamoDBDataNœud D

PigActivity

Exécute un script Pig sur un cluster Amazon EMR.

RedshiftCopyActivity

Copie les données depuis et vers les tables Amazon Redshift.

ShellCommandActivity

Exécute une commande shell UNIX/Linux personnalisée comme une activité.

SqlActivity

Exécute une requête SQL sur une base de données.

Certaines activités assurent la prise en charge spéciale des données et tables de base de données intermédiaires. Pour plus d’informations, consultez Copie intermédiaire des données et des tables avec les activités de pipeline.