Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pemecahan Masalah
Jika Anda mengalami kesalahan dalam Transformasi SageMaker Batch Amazon, lihat tips pemecahan masalah berikut.
Kesalahan batas waktu maks
Jika Anda mendapatkan kesalahan batas waktu maksimal saat menjalankan pekerjaan transformasi batch, coba yang berikut ini:
Mulailah dengan catatan tunggal
BatchStrategy
, ukuran batch default (6 MB) atau lebih kecil yang Anda tentukan dalamMaxPayloadInMB
parameter, dan kumpulan data sampel kecil. Setel parameter batas waktu maksimumInvocationsTimeoutInSeconds
(yang memiliki maksimum 1 jam) hingga Anda menerima respons pemanggilan yang berhasil.Setelah Anda menerima respons pemanggilan yang berhasil, tingkatkan
MaxPayloadInMB
(yang memiliki maksimum 100 MB) danInvocationsTimeoutInSeconds
parameter bersama-sama untuk menemukan ukuran batch maksimum yang dapat mendukung batas waktu model yang Anda inginkan. Anda dapat menggunakan rekaman tunggal atau multi-rekamanBatchStrategy
dalam langkah ini.catatan
Melebihi
MaxPayloadInMB
batas menyebabkan kesalahan. Ini mungkin terjadi dengan kumpulan data besar jika tidak dapat dibagi,SplitType
parameter disetel ke tidak ada, atau catatan individu dalam kumpulan data melebihi batas.(Opsional) Setel
MaxConcurrentTransforms
parameter, yang menentukan jumlah maksimum permintaan paralel yang dapat dikirim ke setiap instance dalam pekerjaan transformasi batch. Namun, nilai tidakMaxConcurrentTransforms * MaxPayloadInMB
boleh melebihi 100 MB.
Output tidak lengkap
SageMaker menggunakan Unggahan Multipart Amazon S3 API untuk mengunggah hasil dari pekerjaan transformasi batch ke Amazon S3. Jika terjadi kesalahan, hasil yang diunggah akan dihapus dari Amazon S3. Dalam beberapa kasus, seperti ketika terjadi pemadaman jaringan, unggahan multibagian yang tidak lengkap mungkin tetap ada di Amazon S3. Upload yang tidak lengkap mungkin juga terjadi jika Anda memiliki beberapa file input tetapi beberapa file tidak dapat diproses oleh SageMaker Batch Transform. File input yang tidak dapat diproses tidak akan memiliki file output yang sesuai di Amazon S3.
Untuk menghindari biaya penyimpanan, sebaiknya tambahkan kebijakan bucket S3 ke aturan siklus hidup bucket S3. Kebijakan ini menghapus unggahan multibagian yang tidak lengkap yang mungkin disimpan di bucket S3. Untuk informasi lebih lanjut, lihat Manajemen Siklus Aktif Objek.
Job menunjukkan sebagai failed
Jika pekerjaan transformasi batch gagal memproses file input karena masalah dengan kumpulan data, SageMaker tandai pekerjaan tersebut sebagaifailed
. Jika file input berisi catatan buruk, tugas transformasi tidak membuat file output untuk file input itu karena hal itu mencegahnya mempertahankan urutan yang sama dalam data yang diubah seperti pada file input. Ketika kumpulan data Anda memiliki beberapa file input, pekerjaan transformasi terus memproses file input meskipun gagal memprosesnya. File yang diproses masih menghasilkan hasil yang dapat digunakan.
Jika Anda menggunakan algoritme Anda sendiri, Anda dapat menggunakan teks placeholder, sepertiERROR
, ketika algoritme menemukan catatan buruk dalam file input. Misalnya, jika catatan terakhir dalam kumpulan data buruk, algoritme menempatkan teks placeholder untuk catatan itu di file output.