Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Buat jadwal untuk memproses data baru secara otomatis
catatan
Bagian berikut hanya berlaku untuk pekerjaan SageMaker Pemrosesan. Jika Anda menggunakan pengaturan Canvas default atau EMR Tanpa Server untuk membuat pekerjaan jarak jauh untuk menerapkan transformasi ke kumpulan data lengkap Anda, bagian ini tidak berlaku.
Jika Anda memproses data secara berkala, Anda dapat membuat jadwal untuk menjalankan pekerjaan pemrosesan secara otomatis. Misalnya, Anda dapat membuat jadwal yang menjalankan pekerjaan pemrosesan secara otomatis saat Anda mendapatkan data baru. Untuk informasi selengkapnya tentang memproses pekerjaan, lihatEkspor ke Amazon S3.
Saat membuat pekerjaan, Anda harus menentukan IAM peran yang memiliki izin untuk membuat pekerjaan. Anda dapat menggunakan AmazonSageMakerCanvasDataPrepFullAccesskebijakan untuk menambahkan izin.
Tambahkan kebijakan kepercayaan berikut ke peran untuk memungkinkan untuk EventBridge mengasumsikannya.
{ "Effect": "Allow", "Principal": { "Service": "events.amazonaws.com" }, "Action": "sts:AssumeRole" }
penting
Saat Anda membuat jadwal, Data Wrangler membuat eventRule
in. EventBridge Anda dikenakan biaya untuk aturan acara yang Anda buat dan instance yang digunakan untuk menjalankan pekerjaan pemrosesan.
Untuk informasi tentang EventBridge harga, lihat EventBridge harga Amazon
Anda dapat mengatur jadwal menggunakan salah satu metode berikut:
-
catatan
Data Wrangler tidak mendukung ekspresi berikut:
-
LW#
-
Singkatan untuk hari
-
Singkatan untuk bulan
-
-
Berulang — Tetapkan interval per jam atau harian untuk menjalankan pekerjaan.
-
Waktu spesifik - Tetapkan hari dan waktu tertentu untuk menjalankan pekerjaan.
Bagian berikut menyediakan prosedur penjadwalan pekerjaan saat mengisi pengaturan pekerjaan SageMaker Pemrosesan saat mengekspor data Anda ke Amazon S3. Semua instruksi berikut dimulai di bagian Jadwal asosiasi dari pengaturan pekerjaan SageMaker Pemrosesan.
Anda dapat menggunakan SageMaker AWS Management Console untuk melihat pekerjaan yang dijadwalkan untuk dijalankan. Pekerjaan pemrosesan Anda berjalan di dalam Pipelines. Setiap pekerjaan pemrosesan memiliki pipa sendiri. Ini berjalan sebagai langkah pemrosesan di dalam pipa. Anda dapat melihat jadwal yang telah Anda buat dalam pipeline. Untuk informasi tentang melihat pipeline, lihatLihat detail pipa.
Gunakan prosedur berikut untuk melihat pekerjaan yang telah Anda jadwalkan.
Untuk melihat pekerjaan yang telah Anda jadwalkan, lakukan hal berikut.
-
Buka Amazon SageMaker Studio Classic.
-
Buka Pipa
-
Lihat saluran pipa untuk pekerjaan yang telah Anda buat.
Pipeline yang menjalankan pekerjaan menggunakan nama pekerjaan sebagai awalan. Misalnya, jika Anda telah membuat pekerjaan bernama
housing-data-feature-enginnering
, nama pipeline adalahcanvas-data-prep-housing-data-feature-engineering
. -
Pilih pipeline yang berisi pekerjaan Anda.
-
Lihat status jaringan pipa. Pipelines dengan Status Sukses telah menjalankan pekerjaan pemrosesan dengan sukses.
Untuk menghentikan pekerjaan pemrosesan berjalan, lakukan hal berikut:
Untuk menghentikan pekerjaan pemrosesan agar tidak berjalan, hapus aturan acara yang menentukan jadwal. Menghapus aturan acara menghentikan semua pekerjaan yang terkait dengan jadwal berjalan. Untuk informasi tentang menghapus aturan, lihat Menonaktifkan atau menghapus aturan Amazon. EventBridge
Anda dapat menghentikan dan menghapus saluran pipa yang terkait dengan jadwal juga. Untuk informasi tentang menghentikan pipa, lihat StopPipelineExecution. Untuk informasi tentang menghapus pipeline, lihat DeletePipeline.