Pagar pembatas penyebaran untuk memperbarui model dalam produksi - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pagar pembatas penyebaran untuk memperbarui model dalam produksi

Pagar pembatas penerapan adalah serangkaian opsi penerapan model di SageMaker Inferensi Amazon untuk memperbarui model pembelajaran mesin Anda dalam produksi. Dengan menggunakan opsi penerapan yang dikelola sepenuhnya, Anda dapat mengontrol sakelar dari model saat ini dalam produksi ke yang baru. Mode perpindahan lalu lintas dalam penerapan biru/hijau, seperti kenari dan linier, memberi Anda kontrol terperinci atas proses perpindahan lalu lintas dari model Anda saat ini ke yang baru selama pembaruan. Ada juga perlindungan bawaan seperti auto-rollback yang membantu Anda menangkap masalah lebih awal dan secara otomatis mengambil tindakan korektif sebelum berdampak signifikan pada produksi.

Pagar pembatas penyebaran memberikan manfaat sebagai berikut:

  • Keamanan penerapan saat memperbarui lingkungan produksi. Pembaruan regresif ke lingkungan produksi dapat menyebabkan downtime dan dampak bisnis yang tidak direncanakan, seperti peningkatan latensi model dan tingkat kesalahan yang tinggi. Pagar pembatas penerapan membantu Anda mengurangi risiko tersebut dengan menyediakan praktik terbaik dan pagar keselamatan operasional bawaan.

  • Penyebaran yang dikelola sepenuhnya. SageMaker menangani pengaturan dan mengatur penerapan ini dan mengintegrasikannya dengan mekanisme pembaruan titik akhir. Anda tidak perlu membangun dan memelihara mekanisme orkestrasi, pemantauan, atau rollback. Anda dapat memanfaatkan SageMaker untuk mengatur dan mengatur penerapan ini dan fokus pada pemanfaatan ML untuk aplikasi Anda.

  • Visibilitas. Anda dapat melacak kemajuan penerapan Anda melalui DescribeEndpointAPIatau melalui CloudWatch Acara Amazon (untuk titik akhir yang didukung). Untuk mempelajari lebih lanjut tentang peristiwa di SageMaker, lihat bagian Perubahan status penerapan titik akhir di. Acara yang SageMaker dikirim Amazon ke Amazon EventBridge Perhatikan bahwa jika titik akhir Anda menggunakan salah satu fitur di Pengecualian halaman, Anda tidak dapat menggunakan CloudWatch Acara.

catatan

Pagar pembatas penerapan hanya berlaku untuk Inferensi asinkron dan Inferensi waktu nyata tipe titik akhir.

Cara memulai

Kami mendukung dua jenis penerapan untuk memperbarui model dalam produksi: penerapan biru/hijau dan penerapan bergulir.

  • Deployment Blue/Green: Anda dapat mengalihkan lalu lintas dari armada lama Anda (armada biru) ke armada baru (armada hijau) dengan pembaruan. Penerapan biru/hijau menawarkan beberapa mode perpindahan lalu lintas. Mode perpindahan lalu lintas adalah konfigurasi yang menentukan cara SageMaker merutekan lalu lintas titik akhir ke armada baru yang berisi pembaruan Anda. Mode perpindahan lalu lintas berikut memberi Anda berbagai tingkat kontrol atas proses pembaruan titik akhir:

    • Gunakan sekaligus perpindahan lalu lintasmenggeser semua lalu lintas titik akhir Anda dari armada biru ke armada hijau. Setelah lalu lintas bergeser ke armada hijau, CloudWatch alarm Amazon Anda yang telah ditentukan sebelumnya mulai memantau armada hijau untuk jangka waktu tertentu (periode pemanggangan). Jika tidak ada alarm yang tersandung selama periode memanggang, maka SageMaker hentikan armada biru.

    • Gunakan perpindahan lalu lintas kenarimenggeser satu bagian kecil dari lalu lintas Anda (kenari) ke armada hijau dan memantaunya untuk periode pemanggangan. Jika kenari berhasil di armada hijau, maka SageMaker menggeser sisa lalu lintas dari armada biru ke armada hijau sebelum mengakhiri armada biru.

    • Gunakan perpindahan lalu lintas liniermenyediakan lebih banyak penyesuaian atas jumlah langkah pergeseran lalu lintas dan persentase lalu lintas yang harus digeser untuk setiap langkah. Sementara pergeseran kenari memungkinkan Anda menggeser lalu lintas dalam dua langkah, pergeseran linier memperluas ini ke n langkah spasi linier.

  • Gunakan penerapan bergulir: Anda dapat memperbarui titik akhir Anda karena SageMaker secara bertahap menyediakan kapasitas dan menggeser lalu lintas ke armada baru dalam langkah-langkah ukuran batch yang Anda tentukan. Instans pada armada baru diperbarui dengan konfigurasi penyebaran baru, dan jika tidak ada CloudWatch alarm yang tersandung selama periode pemanggangan, maka SageMaker bersihkan instance pada armada lama. Opsi ini memberi Anda kontrol terperinci atas jumlah instans atau persentase kapasitas yang digeser selama setiap langkah.

Anda dapat membuat dan mengelola penyebaran Anda melalui UpdateEndpointdan CreateEndpoint SageMaker APIdan AWS Command Line Interface perintah. Lihat halaman penerapan individual untuk detail selengkapnya tentang cara mengatur penerapan Anda. Perhatikan bahwa jika titik akhir Anda menggunakan salah satu fitur yang tercantum di Pengecualian halaman, Anda tidak dapat menggunakan pagar pembatas penerapan.

Untuk mengikuti contoh terpandu yang menunjukkan cara menggunakan pagar pembatas penerapan, lihat contoh notebook Jupyter kami untuk mode perpindahan lalu lintas kenari dan linier.