AWS Data Pipeline não está mais disponível para novos clientes. Clientes existentes da AWS Data Pipeline pode continuar usando o serviço normalmente. Saiba mais
As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Atividades
Em AWS Data Pipeline, uma atividade é um componente do pipeline que define o trabalho a ser executado. AWS Data Pipeline fornece várias atividades pré-empacotadas que acomodam cenários comuns, como mover dados de um local para outro, executar consultas do Hive e assim por diante. As atividades são extensíveis. Assim, você pode executar seus próprios scripts personalizados para oferecer suporte a infinitas combinações.
AWS Data Pipeline suporta os seguintes tipos de atividades:
- CopyActivity
-
Copia dados de um local para outro.
- EmrActivity
-
Executa o cluster do Amazon EMR.
- HiveActivity
-
Executa uma consulta do Hive em um cluster do Amazon EMR.
- HiveCopyActivity
-
Executa uma consulta do Hive em um cluster do Amazon EMR com suporte para filtragem avançada de dados, além de suporte a S3 DataNode e a ynamoDBDataNodo D.
- PigActivity
-
Executa um script do Pig em um cluster do Amazon EMR.
- RedshiftCopyActivity
-
Copia dados entre as tabelas do Amazon Redshift.
- ShellCommandActivity
-
Executa um comando shell UNIX/Linux personalizado como uma atividade.
- SqlActivity
-
Executa uma consulta SQL em um banco de dados.
Algumas atividades contam com suporte especial para preparação de dados e tabelas de banco de dados. Para ter mais informações, consulte Preparar dados e tabelas com atividades de pipeline.