Tes bayangan - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Tes bayangan

Dengan Amazon, SageMaker Anda dapat mengevaluasi perubahan apa pun pada infrastruktur penyajian model Anda dengan membandingkan kinerjanya dengan infrastruktur yang saat ini digunakan. Praktik ini dikenal sebagai pengujian bayangan. Pengujian bayangan dapat membantu Anda menangkap potensi kesalahan konfigurasi dan masalah kinerja sebelum berdampak pada pengguna akhir. Dengan SageMaker, Anda tidak perlu berinvestasi dalam membangun infrastruktur pengujian bayangan Anda, sehingga Anda dapat fokus pada pengembangan model.

Anda dapat menggunakan kemampuan ini untuk memvalidasi perubahan pada komponen apa pun dari varian produksi Anda, yaitu model, wadah, atau instance, tanpa dampak pengguna akhir. Ini berguna dalam situasi termasuk tetapi tidak terbatas pada hal-hal berikut:

  • Anda sedang mempertimbangkan untuk mempromosikan model baru yang telah divalidasi secara offline ke produksi, tetapi ingin mengevaluasi metrik kinerja operasional seperti latensi dan tingkat kesalahan sebelum membuat keputusan ini.

  • Anda sedang mempertimbangkan perubahan pada wadah infrastruktur penyajian Anda, seperti menambal kerentanan atau meningkatkan ke versi yang lebih baru, dan ingin menilai dampak dari perubahan ini sebelum promosi ke produksi.

  • Anda sedang mempertimbangkan untuk mengubah instance HTML Anda dan ingin mengevaluasi kinerja instance baru dengan permintaan inferensi langsung.

SageMaker Konsol memberikan pengalaman terpandu untuk mengelola alur kerja pengujian bayangan. Anda dapat mengatur tes bayangan untuk durasi waktu yang telah ditentukan, memantau kemajuan pengujian melalui dasbor langsung, membersihkan setelah selesai, dan menindaklanjuti hasilnya. Pilih varian produksi yang ingin Anda uji, dan SageMaker secara otomatis menerapkan varian baru dalam mode bayangan dan merutekan salinan permintaan inferensi ke sana secara real time dalam titik akhir yang sama. Hanya tanggapan dari varian produksi yang dikembalikan ke aplikasi panggilan. Anda dapat memilih untuk membuang atau mencatat respons varian bayangan untuk perbandingan offline. Untuk informasi lebih lanjut tentang varian produksi dan bayangan, lihatValidasi model dalam produksi.

Lihat Buat tes bayangan petunjuk tentang cara membuat tes bayangan.

catatan

Fitur titik akhir tertentu dapat membuat titik akhir Anda tidak kompatibel dengan pengujian bayangan. Jika titik akhir Anda menggunakan salah satu fitur berikut, Anda tidak dapat menggunakan pengujian bayangan pada titik akhir Anda, dan permintaan Anda untuk menyiapkan pengujian bayangan akan menyebabkan kesalahan validasi.

  • Inferensi tanpa server

  • Inferensi asinkron

  • Kontainer Marketplace

  • Titik akhir multi-kontainer

  • Titik akhir multi-model

  • Titik akhir yang menggunakan instance Inf1 (berbasis inferensia)