Copie dados CSV entre buckets do Amazon S3 usando AWS Data Pipeline - AWS Data Pipeline

AWS Data Pipeline não está mais disponível para novos clientes. Os clientes existentes do AWS Data Pipeline podem continuar usando o serviço normalmente. Saiba mais

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Copie dados CSV entre buckets do Amazon S3 usando AWS Data Pipeline

Depois de ler O que AWS Data Pipelineé e decidir que deseja usar para AWS Data Pipeline automatizar a movimentação e a transformação de seus dados, é hora de começar a criar pipelines de dados. Para ajudar você a entender como o AWS Data Pipeline funciona, mostraremos o passo a passo de uma tarefa simples.

Este tutorial orienta você no processo de criação de um pipeline de dados para copiar dados de um bucket do Amazon S3 para outro e, em seguida, enviar uma notificação do Amazon SNS após a conclusão com êxito da atividade de cópia. Você usa uma EC2 instância gerenciada por AWS Data Pipeline para essa atividade de cópia.

Objetos de pipeline

O pipeline usa os seguintes objetos:

CopyActivity

A atividade que é AWS Data Pipeline executada para esse pipeline (copiar dados CSV de um bucket do Amazon S3 para outro).

Importante

Há limitações ao usar o formato de arquivo CSV com CopyActivity e S3DataNode. Para obter mais informações, consulte CopyActivity.

Programação

A data de início, hora e recorrência dessa atividade. Se preferir, você pode especificar a data e a hora de término.

Ec2Resource

O recurso (uma EC2 instância) AWS Data Pipeline usado para realizar essa atividade.

S3 DataNode

Os nós de entrada e saída (buckets do Amazon S3) deste pipeline.

SnsAlarm

A ação AWS Data Pipeline deve ser tomada quando as condições especificadas forem atendidas (enviar notificações do Amazon SNS para um tópico após a conclusão bem-sucedida da tarefa).