Apa itu AWS Data Pipeline? - AWS Data Pipeline

AWS Data Pipeline tidak lagi tersedia untuk pelanggan baru. Pelanggan yang sudah ada dari AWS Data Pipeline dapat terus menggunakan layanan seperti biasa. Pelajari selengkapnya

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apa itu AWS Data Pipeline?

catatan

AWS Data Pipeline layanan dalam mode pemeliharaan dan tidak ada fitur baru atau perluasan wilayah yang direncanakan. Untuk mempelajari lebih lanjut dan mengetahui cara memigrasi beban kerja yang ada, lihat. Migrasi beban kerja dari AWS Data Pipeline

AWS Data Pipeline adalah layanan web yang dapat Anda gunakan untuk mengotomatiskan pergerakan dan transformasi data. Dengan AWS Data Pipeline, Anda dapat menentukan alur kerja berbasis data, sehingga tugas dapat bergantung pada keberhasilan penyelesaian tugas sebelumnya. Anda menentukan parameter transformasi data Anda dan AWS Data Pipeline menerapkan logika yang telah Anda atur.

Komponen berikut AWS Data Pipeline bekerja sama untuk mengelola data Anda:

  • Sebuah definisi alur menentukan logika bisnis manajemen data Anda. Untuk informasi selengkapnya, lihat Sintaks berkas definisi pipa.

  • Sebuah jadwal alur dan menjalankan tugas dengan menciptakan instans Amazon EC2 untuk melakukan kegiatan kerja yang didefinisikan. Anda mengunggah definisi alur Anda ke alur, dan kemudian mengaktifkan alur. Anda dapat mengedit definisi alur untuk alur berjalan dan mengaktifkan alur kembali agar alur dapat bekerja. Anda dapat menonaktifkan alur, memodifikasi sumber data, dan kemudian mengaktifkan alur kembali. Setelah Anda selesai dengan alur, Anda dapat menghapusnya.

  • Task Runner membuat poling untuk tugas lalu melakukan tugas tersebut. Misalnya, Task Runner bisa menyalin berkas log ke Amazon S3 dan meluncurkan klaster Amazon EMR. Task Runner diinstal dan berjalan secara otomatis pada sumber daya yang dibuat oleh definisi alur Anda. Anda dapat menulis aplikasi task runner kustom, atau Anda dapat menggunakan aplikasi Task Runner yang disediakan oleh. AWS Data Pipeline Untuk informasi selengkapnya, lihat Runner Tugas.

Misalnya, Anda dapat menggunakannya AWS Data Pipeline untuk mengarsipkan log server web Anda ke Amazon Simple Storage Service (Amazon S3) setiap hari dan kemudian menjalankan klaster Amazon EMR (Amazon EMR) mingguan di atas log tersebut untuk menghasilkan laporan lalu lintas. AWS Data Pipeline menjadwalkan tugas harian untuk menyalin data dan tugas mingguan untuk meluncurkan cluster EMR Amazon. AWS Data Pipeline juga memastikan bahwa Amazon EMR menunggu data hari terakhir diunggah ke Amazon S3 sebelum memulai analisisnya, bahkan jika ada penundaan yang tidak terduga dalam mengunggah log.

AWS Data Pipeline ikhtisar fungsional

Mengakses AWS Data Pipeline

Anda dapat membuat, mengakses, dan mengelola alur Anda menggunakan salah satu antarmuka berikut:

  • AWS Management Console — Menyediakan antarmuka web yang dapat Anda gunakan untuk mengakses AWS Data Pipeline.

  • AWS Command Line Interface (AWS CLI) — Menyediakan perintah untuk serangkaian layanan AWS yang luas, termasuk AWS Data Pipeline, dan didukung di Windows, macOS, dan Linux. Untuk informasi lebih lanjut tentang menginstal AWS CLI, lihat AWS Command Line Interface. Untuk daftar perintah AWS Data Pipeline, lihat datapipeline.

  • AWS SDK — Menyediakan API khusus bahasa dan menangani banyak detail koneksi, seperti menghitung tanda tangan, menangani percobaan ulang permintaan, dan penanganan kesalahan. Untuk informasi selengkapnya, lihat AWS SDK.

  • Kueri API — Menyediakan API tingkat rendah yang Anda panggil menggunakan permintaan HTTPS. Menggunakan API Kueri merupakan cara paling langsung untuk mengakses AWS Data Pipeline, tetapi mengharuskan aplikasi Anda menangani detail tingkat rendah seperti membuat hash untuk menandatangani permintaan, dan penanganan kesalahan. Untuk informasi lebih lanjut, lihat AWS Data Pipeline Referensi API.

Harga

Dengan Amazon Web Services, Anda hanya membayar untuk apa yang Anda gunakan. Untuk AWS Data Pipeline, Anda membayar pipa Anda berdasarkan seberapa sering aktivitas dan prasyarat Anda dijadwalkan untuk dijalankan dan di mana mereka berjalan. Untuk informasi selengkapnya, silakan lihat Harga AWS Data Pipeline.

Jika akun AWS Anda berusia kurang dari 12 bulan, Anda berhak untuk menggunakan tingkat gratis. Tingkat gratis mencakup tiga prasyarat frekuensi rendah dan lima aktivitas frekuensi rendah per bulan tanpa biaya. Untuk informasi selengkapnya, lihat AWS Tingkat Gratis.