Edit langkah aliran data - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Edit langkah aliran data

Di Amazon SageMaker Canvas, Anda dapat mengedit langkah individual dalam alur data untuk mengubah kumpulan data Anda tanpa harus membuat aliran data baru. Halaman berikut mencakup cara mengedit langkah-langkah bergabung dan menggabungkan, serta langkah-langkah sumber data.

Edit bergabung dan menggabungkan langkah-langkah

Dalam alur data Anda, Anda memiliki fleksibilitas untuk mengedit langkah bergabung dan menggabungkan Anda. Anda dapat membuat penyesuaian yang diperlukan pada alur kerja pemrosesan data Anda, memastikan bahwa data Anda digabungkan dan diubah dengan benar tanpa harus mengulang seluruh aliran data Anda.

Untuk mengedit langkah bergabung atau menggabungkan dalam aliran data Anda, lakukan hal berikut:

  1. Buka aliran data Anda.

  2. Pilih ikon plus (+) di sebelah node join atau concatenate yang ingin Anda edit.

  3. Dari menu konteks, pilih Edit.

  4. Panel samping terbuka di mana Anda dapat mengedit detail gabungan atau penggabungan Anda. Ubah bidang langkah Anda, seperti jenis gabungan. Untuk menukar node data dan memilih yang berbeda untuk bergabung atau digabungkan, pilih ikon hapus di sebelah node dan kemudian, dalam tampilan aliran data, pilih node baru yang ingin Anda sertakan dalam transformasi Anda.

    catatan

    Saat menukar node selama proses pengeditan, Anda hanya dapat memilih langkah-langkah yang terjadi sebelum operasi gabungan atau penggabungan. Anda dapat menukar node kiri atau kanan, tetapi Anda hanya dapat menukar satu node pada satu waktu. Selain itu, Anda tidak dapat memilih node sumber sebagai pengganti.

  5. Pilih Pratinjau untuk melihat hasil operasi penggabungan.

  6. Pilih Perbarui untuk menyimpan perubahan.

Aliran data Anda sekarang harus diperbarui.

Mengedit atau mengganti langkah sumber data

Anda mungkin perlu membuat perubahan pada sumber data atau kumpulan data Anda tanpa menghapus transformasi dan langkah aliran data yang diterapkan pada data asli Anda. Dalam Data Wrangler, Anda dapat mengedit atau mengganti konfigurasi sumber data Anda sambil menjaga langkah-langkah aliran data Anda. Saat mengedit sumber data, Anda dapat mengubah pengaturan impor, seperti ukuran atau metode pengambilan sampel dan pengaturan lanjutan apa pun. Anda juga dapat menambahkan lebih banyak file dengan skema yang sama, atau untuk sumber data berbasis kueri seperti Amazon Athena, Anda dapat mengedit kueri. Saat mengganti sumber data, Anda memiliki opsi untuk memilih kumpulan data yang berbeda, atau bahkan mengimpor data dari sumber data yang berbeda sama sekali, selama skema data baru cocok dengan data asli.

Untuk mengedit konfigurasi sumber data, lakukan hal berikut:

  1. Di aplikasi Canvas, buka halaman Data Wrangler.

  2. Pilih aliran data Anda untuk melihatnya.

  3. Di tab Aliran data yang menunjukkan langkah aliran data Anda, temukan simpul Sumber yang ingin Anda edit.

  4. Pilih ikon elipsis di sebelah simpul Sumber.

  5. Dari menu konteks, pilih Edit.

  6. Untuk sumber data Amazon S3 dan unggahan lokal, Anda memiliki opsi untuk memilih atau mengunggah lebih banyak file dengan skema yang sama dengan data asli Anda. Untuk sumber data berbasis kueri seperti Amazon Athena, Anda dapat menghapus dan memilih tabel yang berbeda di pembuat kueri visual, atau Anda dapat mengedit kueri SQL secara langsung. Setelah selesai, pilih Berikutnya.

  7. Untuk pengaturan Impor, buat perubahan yang diinginkan.

  8. Setelah selesai, pilih Simpan perubahan.

Sumber data Anda sekarang harus diperbarui.

Untuk mengganti sumber data, lakukan hal berikut:

  1. Di aplikasi Canvas, buka halaman Data Wrangler.

  2. Pilih aliran data Anda untuk melihatnya.

  3. Di tab Aliran data yang menunjukkan langkah aliran data Anda, temukan simpul Sumber yang ingin Anda edit.

  4. Pilih ikon elipsis di sebelah simpul Sumber.

  5. Dari menu konteks, pilih Ganti.

  6. Pergi melalui pengalaman membuat aliran data untuk memilih sumber data dan data lain.

  7. Ketika Anda telah memilih data Anda dan siap untuk memperbarui simpul sumber, pilih Simpan.

Anda sekarang harus melihat node Sumber diperbarui dalam aliran data Anda.