Aktivitas - AWS Data Pipeline

AWS Data Pipeline tidak lagi tersedia untuk pelanggan baru. Pelanggan yang sudah ada dari AWS Data Pipeline dapat terus menggunakan layanan seperti biasa. Pelajari selengkapnya

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Aktivitas

Dalam AWS Data Pipeline, aktivitas adalah komponen pipa yang mendefinisikan pekerjaan yang akan dilakukan. AWS Data Pipeline menyediakan beberapa aktivitas pra-paket yang mengakomodasi skenario umum, seperti memindahkan data dari satu lokasi ke lokasi lain, menjalankan kueri Hive, dan sebagainya. Aktivitas dapat diperluas, sehingga Anda dapat menjalankan skrip kustom Anda sendiri untuk mendukung kombinasi tanpa akhir.

AWS Data Pipeline mendukung jenis kegiatan berikut:

CopyActivity

Menyalin data dari satu lokasi ke lokasi lain.

EmrActivity

Menjalankan klaster Amazon EMR.

HiveActivity

Menjalankan kueri Hive pada klaster Amazon EMR.

HiveCopyActivity

Menjalankan kueri Hive di klaster Amazon EMR dengan dukungan untuk pemfilteran data tingkat lanjut dan dukungan untuk S3 DataNode dan D ynamoDBData Simpul.

PigActivity

Menjalankan skrip Pig di klaster Amazon EMR.

RedshiftCopyActivity

Menyalin data ke dan dari tabel Amazon Redshift.

ShellCommandActivity

Menjalankan perintah shell UNIX/Linux khusus sebagai aktivitas.

SqlActivity

Menjalankan kueri SQL pada basis data.

Beberapa aktivitas memiliki dukungan khusus untuk menyiapkan data dan tabel basis data. Untuk informasi selengkapnya, lihat Penahapan Data dan Tabel dengan Aktivitas Alur.