AWS Data Pipeline tidak lagi tersedia untuk pelanggan baru. Pelanggan yang sudah ada dari AWS Data Pipeline dapat terus menggunakan layanan seperti biasa. Pelajari selengkapnya
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Aktivitas
Dalam AWS Data Pipeline, aktivitas adalah komponen pipa yang mendefinisikan pekerjaan yang akan dilakukan. AWS Data Pipeline menyediakan beberapa aktivitas pra-paket yang mengakomodasi skenario umum, seperti memindahkan data dari satu lokasi ke lokasi lain, menjalankan kueri Hive, dan sebagainya. Aktivitas dapat diperluas, sehingga Anda dapat menjalankan skrip kustom Anda sendiri untuk mendukung kombinasi tanpa akhir.
AWS Data Pipeline mendukung jenis kegiatan berikut:
- CopyActivity
-
Menyalin data dari satu lokasi ke lokasi lain.
- EmrActivity
-
Menjalankan klaster Amazon EMR.
- HiveActivity
-
Menjalankan kueri Hive pada klaster Amazon EMR.
- HiveCopyActivity
-
Menjalankan kueri Hive di klaster Amazon EMR dengan dukungan untuk pemfilteran data tingkat lanjut dan dukungan untuk S3 DataNode dan D ynamoDBData Simpul.
- PigActivity
-
Menjalankan skrip Pig di klaster Amazon EMR.
- RedshiftCopyActivity
-
Menyalin data ke dan dari tabel Amazon Redshift.
- ShellCommandActivity
-
Menjalankan perintah shell UNIX/Linux khusus sebagai aktivitas.
- SqlActivity
-
Menjalankan kueri SQL pada basis data.
Beberapa aktivitas memiliki dukungan khusus untuk menyiapkan data dan tabel basis data. Untuk informasi selengkapnya, lihat Penahapan Data dan Tabel dengan Aktivitas Alur.