Attività - AWS Data Pipeline

AWS Data Pipeline non è più disponibile per i nuovi clienti. Clienti esistenti di AWS Data Pipeline possono continuare a utilizzare il servizio normalmente. Ulteriori informazioni

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Attività

In AWS Data Pipeline, un'attività è un componente della pipeline che definisce il lavoro da eseguire. AWS Data Pipeline fornisce diverse attività preconfezionate che si adattano a scenari comuni, come lo spostamento dei dati da una posizione all'altra, l'esecuzione di query Hive e così via. Le attività sono estendibili, perciò è possibile eseguire script personalizzati per supportare infinite combinazioni.

AWS Data Pipeline supporta i seguenti tipi di attività:

CopyActivity

Copia i dati da una posizione a un'altra.

EmrActivity

Esegue un cluster Amazon EMR.

HiveActivity

Esegue una query Hive su un cluster Amazon EMR.

HiveCopyActivity

Esegue una query Hive su un cluster Amazon EMR con supporto per il filtraggio avanzato dei dati e supporto per e. S3 DataNode ynamoDBDataNodo D

PigActivity

Esegue uno script Pig su un cluster Amazon EMR.

RedshiftCopyActivity

Copia i dati da e verso le tabelle Amazon Redshift.

ShellCommandActivity

Esegue un comando shell Linux/UNIX personalizzato come attività.

SqlActivity

Esegue una query SQL su un database.

Alcune attività hanno un supporto speciale per la gestione temporanea dei dati e delle tabelle di database. Per ulteriori informazioni, consulta Dati e tabelle in gestione temporanea con attività della pipeline.