Pemecahan Masalah - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pemecahan Masalah

Jika Anda mengalami kesalahan dalam Transformasi SageMaker Batch Amazon, lihat tips pemecahan masalah berikut.

Kesalahan batas waktu maks

Jika Anda mendapatkan kesalahan batas waktu maksimal saat menjalankan pekerjaan transformasi batch, coba yang berikut ini:

  • Mulailah dengan catatan tunggalBatchStrategy, ukuran batch default (6 MB) atau lebih kecil yang Anda tentukan dalam MaxPayloadInMB parameter, dan kumpulan data sampel kecil. Setel parameter batas waktu maksimum InvocationsTimeoutInSeconds (yang memiliki maksimum 1 jam) hingga Anda menerima respons pemanggilan yang berhasil.

  • Setelah Anda menerima respons pemanggilan yang berhasil, tingkatkan MaxPayloadInMB (yang memiliki maksimum 100 MB) dan InvocationsTimeoutInSeconds parameter bersama-sama untuk menemukan ukuran batch maksimum yang dapat mendukung batas waktu model yang Anda inginkan. Anda dapat menggunakan rekaman tunggal atau multi-rekaman BatchStrategy dalam langkah ini.

    catatan

    Melebihi MaxPayloadInMB batas menyebabkan kesalahan. Ini mungkin terjadi dengan kumpulan data besar jika tidak dapat dibagi, SplitType parameter disetel ke tidak ada, atau catatan individu dalam kumpulan data melebihi batas.

  • (Opsional) Setel MaxConcurrentTransforms parameter, yang menentukan jumlah maksimum permintaan paralel yang dapat dikirim ke setiap instance dalam pekerjaan transformasi batch. Namun, nilai tidak MaxConcurrentTransforms * MaxPayloadInMB boleh melebihi 100 MB.

Output tidak lengkap

SageMaker menggunakan Unggahan Multipart Amazon S3 API untuk mengunggah hasil dari pekerjaan transformasi batch ke Amazon S3. Jika terjadi kesalahan, hasil yang diunggah akan dihapus dari Amazon S3. Dalam beberapa kasus, seperti ketika terjadi pemadaman jaringan, unggahan multibagian yang tidak lengkap mungkin tetap ada di Amazon S3. Upload yang tidak lengkap mungkin juga terjadi jika Anda memiliki beberapa file input tetapi beberapa file tidak dapat diproses oleh SageMaker Batch Transform. File input yang tidak dapat diproses tidak akan memiliki file output yang sesuai di Amazon S3.

Untuk menghindari biaya penyimpanan, sebaiknya tambahkan kebijakan bucket S3 ke aturan siklus hidup bucket S3. Kebijakan ini menghapus unggahan multibagian yang tidak lengkap yang mungkin disimpan di bucket S3. Untuk informasi lebih lanjut, lihat Manajemen Siklus Aktif Objek.

Job menunjukkan sebagai failed

Jika pekerjaan transformasi batch gagal memproses file input karena masalah dengan kumpulan data, SageMaker tandai pekerjaan tersebut sebagaifailed. Jika file input berisi catatan buruk, tugas transformasi tidak membuat file output untuk file input itu karena hal itu mencegahnya mempertahankan urutan yang sama dalam data yang diubah seperti pada file input. Ketika kumpulan data Anda memiliki beberapa file input, pekerjaan transformasi terus memproses file input meskipun gagal memprosesnya. File yang diproses masih menghasilkan hasil yang dapat digunakan.

Jika Anda menggunakan algoritme Anda sendiri, Anda dapat menggunakan teks placeholder, sepertiERROR, ketika algoritme menemukan catatan buruk dalam file input. Misalnya, jika catatan terakhir dalam kumpulan data buruk, algoritme menempatkan teks placeholder untuk catatan itu di file output.