Atividades - AWS Data Pipeline

AWS Data Pipeline não está mais disponível para novos clientes. Clientes existentes da AWS Data Pipeline pode continuar usando o serviço normalmente. Saiba mais

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Atividades

Em AWS Data Pipeline, uma atividade é um componente do pipeline que define o trabalho a ser executado. AWS Data Pipeline fornece várias atividades pré-empacotadas que acomodam cenários comuns, como mover dados de um local para outro, executar consultas do Hive e assim por diante. As atividades são extensíveis. Assim, você pode executar seus próprios scripts personalizados para oferecer suporte a infinitas combinações.

AWS Data Pipeline suporta os seguintes tipos de atividades:

CopyActivity

Copia dados de um local para outro.

EmrActivity

Executa o cluster do Amazon EMR.

HiveActivity

Executa uma consulta do Hive em um cluster do Amazon EMR.

HiveCopyActivity

Executa uma consulta do Hive em um cluster do Amazon EMR com suporte para filtragem avançada de dados, além de suporte a S3 DataNode e a ynamoDBDataNodo D.

PigActivity

Executa um script do Pig em um cluster do Amazon EMR.

RedshiftCopyActivity

Copia dados entre as tabelas do Amazon Redshift.

ShellCommandActivity

Executa um comando shell UNIX/Linux personalizado como uma atividade.

SqlActivity

Executa uma consulta SQL em um banco de dados.

Algumas atividades contam com suporte especial para preparação de dados e tabelas de banco de dados. Para ter mais informações, consulte Preparar dados e tabelas com atividades de pipeline.