Persyaratan dataset prediksi Batch - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Persyaratan dataset prediksi Batch

Untuk prediksi batch, pastikan kumpulan data Anda memenuhi persyaratan yang diuraikan. Buat kumpulan data Jika dataset Anda lebih besar dari 5 GB, Canvas menggunakan Amazon EMR Serverless untuk memproses data Anda dan membaginya menjadi batch yang lebih kecil. Setelah data Anda dibagi, Canvas menggunakan SageMaker AI Batch Transform untuk membuat prediksi. Anda mungkin melihat biaya dari kedua layanan ini setelah menjalankan prediksi batch. Untuk informasi lebih lanjut, lihat harga Canvas.

Anda mungkin tidak dapat membuat prediksi pada beberapa kumpulan data jika mereka memiliki skema yang tidak kompatibel. Skema adalah struktur organisasi. Untuk kumpulan data tabular, skema adalah nama kolom dan tipe data data di kolom. Skema yang tidak kompatibel mungkin terjadi karena salah satu alasan berikut:

  • Dataset yang Anda gunakan untuk membuat prediksi memiliki lebih sedikit kolom daripada kumpulan data yang Anda gunakan untuk membangun model.

  • Tipe data di kolom yang Anda gunakan untuk membangun kumpulan data mungkin berbeda dari tipe data dalam kumpulan data yang Anda gunakan untuk membuat prediksi.

  • Dataset yang Anda gunakan untuk membuat prediksi dan kumpulan data yang Anda gunakan untuk membangun model memiliki nama kolom yang tidak cocok. Nama kolom peka huruf besar/kecil. Column1tidak sama dengancolumn1.

Untuk memastikan bahwa Anda berhasil menghasilkan prediksi batch, cocokkan skema kumpulan data prediksi batch Anda dengan kumpulan data yang Anda gunakan untuk melatih model.

catatan

Untuk prediksi batch, jika Anda menjatuhkan kolom apa pun saat membuat model, Canvas menambahkan kolom yang dijatuhkan kembali ke hasil prediksi. Namun, Canvas tidak menambahkan kolom yang dijatuhkan ke prediksi batch Anda untuk model deret waktu.