Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Konfigurasikan pembaruan otomatis untuk kumpulan data
Setelah mengimpor dataset awal ke Amazon SageMaker Canvas, Anda mungkin memiliki data tambahan yang ingin ditambahkan ke kumpulan data Anda. Misalnya, Anda mungkin mendapatkan data inventaris di akhir setiap minggu yang ingin Anda tambahkan ke kumpulan data Anda. Alih-alih mengimpor data Anda beberapa kali, Anda dapat memperbarui kumpulan data yang ada dan menambah atau menghapus file darinya.
catatan
Anda hanya dapat memperbarui kumpulan data yang telah Anda impor melalui unggahan lokal atau Amazon S3.
Dengan pembaruan dataset otomatis, Anda menentukan lokasi di mana Canvas memeriksa file pada frekuensi yang Anda tentukan. Jika Anda mengimpor file baru selama pembaruan, skema file harus sama persis dengan kumpulan data yang ada.
Setiap kali Anda memperbarui dataset Anda, Canvas membuat versi baru dari dataset Anda. Anda hanya dapat menggunakan versi terbaru dari dataset Anda untuk membuat model atau menghasilkan prediksi. Untuk informasi selengkapnya tentang melihat riwayat versi kumpulan data Anda, lihatLihat detail dataset Anda.
Anda juga dapat menggunakan pembaruan kumpulan data dengan prediksi batch otomatis, yang memulai pekerjaan prediksi batch setiap kali Anda memperbarui kumpulan data Anda. Untuk informasi selengkapnya, lihat Prediksi Batch di Canvas SageMaker .
Bagian berikut menjelaskan cara melakukan pembaruan otomatis pada kumpulan data Anda.
Pembaruan otomatis adalah ketika Anda mengatur konfigurasi untuk Canvas untuk memperbarui dataset Anda pada frekuensi tertentu. Kami menyarankan Anda menggunakan opsi ini jika Anda secara teratur menerima file data baru yang ingin Anda tambahkan ke kumpulan data Anda.
Saat mengatur konfigurasi pembaruan otomatis, Anda menentukan lokasi Amazon S3 tempat Anda mengunggah file dan frekuensi di mana Canvas memeriksa lokasi dan mengimpor file. Setiap instance Canvas memperbarui dataset Anda disebut sebagai pekerjaan. Untuk setiap pekerjaan, Canvas mengimpor semua file di lokasi Amazon S3. Jika Anda memiliki file baru dengan nama yang sama dengan file yang ada di dataset Anda, Canvas menimpa file lama dengan file baru.
Untuk pembaruan dataset otomatis, Canvas tidak melakukan validasi skema. Jika skema file yang diimpor selama pembaruan otomatis tidak cocok dengan skema file yang ada atau melebihi batasan ukuran (lihat Mengimpor kumpulan data untuk tabel batasan ukuran file), maka Anda mendapatkan kesalahan saat pekerjaan Anda berjalan.
catatan
Anda hanya dapat mengatur maksimum 20 konfigurasi otomatis di aplikasi Canvas Anda. Selain itu, Canvas hanya melakukan pembaruan otomatis saat Anda masuk ke aplikasi Canvas Anda. Jika Anda keluar dari aplikasi Canvas Anda, pembaruan otomatis berhenti sampai Anda masuk kembali.
Untuk mengonfigurasi pembaruan otomatis untuk kumpulan data Anda, lakukan hal berikut:
-
Buka aplikasi SageMaker Canvas.
-
Di panel navigasi kiri, pilih Datasets.
-
Dari daftar kumpulan data, pilih kumpulan data yang ingin Anda perbarui.
-
Pilih menu tarik-turun Perbarui kumpulan data dan pilih Pembaruan otomatis. Anda akan dibawa ke tab Pembaruan otomatis untuk kumpulan data.
-
Aktifkan sakelar Aktifkan pembaruan otomatis.
-
Untuk Tentukan sumber data, masukkan jalur Amazon S3 ke folder tempat Anda berencana untuk mengunggah file secara teratur.
-
Untuk Pilih frekuensi, pilih Per Jam, Mingguan, atau Harian.
-
Untuk Tentukan waktu mulai, gunakan kalender dan pemilih waktu untuk memilih kapan Anda ingin pekerjaan pembaruan otomatis pertama dimulai.
-
Saat Anda siap membuat konfigurasi pembaruan otomatis, pilih Simpan.
Canvas memulai pekerjaan pertama irama pembaruan otomatis Anda pada waktu mulai yang ditentukan.