Validasi data - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Validasi data

Sebelum membuat model, SageMaker Canvas memeriksa kumpulan data Anda untuk masalah yang mungkin menyebabkan build Anda gagal. Jika SageMaker Canvas menemukan masalah, maka Canvas memperingatkan Anda di halaman Build sebelum Anda mencoba membuat model.

Anda dapat memilih Validasi data untuk melihat daftar masalah dengan kumpulan data Anda. Anda kemudian dapat menggunakan fitur persiapan data SageMaker Canvas Data Wrangler, atau alat Anda sendiri, untuk memperbaiki kumpulan data Anda sebelum memulai pembuatan. Jika Anda tidak memperbaiki masalah dengan kumpulan data Anda, build Anda gagal.

Jika Anda membuat perubahan pada kumpulan data untuk memperbaiki masalah, Anda memiliki opsi untuk memvalidasi ulang kumpulan data Anda sebelum mencoba membangun. Kami menyarankan Anda memvalidasi ulang dataset Anda sebelum membangun.

Tabel berikut menunjukkan masalah yang diperiksa SageMaker Canvas dalam kumpulan data Anda dan cara mengatasinya.

Isu Resolusi

Jenis model yang salah untuk data Anda

Coba jenis model lain atau gunakan kumpulan data yang berbeda.

Nilai yang hilang di kolom target Anda

Ganti nilai yang hilang, jatuhkan baris dengan nilai yang hilang, atau gunakan kumpulan data yang berbeda.

Terlalu banyak label unik di kolom target Anda

Verifikasi bahwa Anda telah menggunakan kolom yang benar untuk kolom target Anda, atau gunakan kumpulan data yang berbeda.

Terlalu banyak nilai non-numerik di kolom target Anda

Pilih kolom target yang berbeda, pilih jenis model lain, atau gunakan kumpulan data yang berbeda.

Satu atau beberapa nama kolom berisi garis bawah ganda

Ganti nama kolom untuk menghapus garis bawah ganda, dan coba lagi.

Tak satu pun dari baris dalam dataset Anda yang lengkap

Ganti nilai yang hilang, atau gunakan kumpulan data yang berbeda.

Terlalu banyak label unik untuk jumlah baris dalam data Anda

Periksa apakah Anda menggunakan kolom target kanan, menambah jumlah baris dalam kumpulan data Anda, mengkonsolidasikan label serupa, atau menggunakan kumpulan data yang berbeda.