Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

Penerapan Model di AI SageMaker

Mode fokus
Penerapan Model di AI SageMaker - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Setelah Anda melatih dan menyetujui model untuk produksi, gunakan SageMaker AI untuk menyebarkan model Anda ke titik akhir untuk inferensi waktu nyata. SageMaker AI menyediakan beberapa opsi inferensi sehingga Anda dapat memilih opsi yang paling sesuai dengan beban kerja Anda. Anda juga mengonfigurasi titik akhir dengan memilih jenis instans dan jumlah instans yang Anda perlukan untuk kinerja optimal. Untuk detail tentang penerapan model, lihatMenyebarkan model untuk inferensi.

Setelah Anda menerapkan model Anda ke produksi, Anda mungkin ingin mencari cara untuk lebih mengoptimalkan kinerja model sambil mempertahankan ketersediaan model Anda saat ini. Misalnya, Anda dapat menyiapkan tes bayangan untuk mencoba model atau model yang berbeda yang melayani infrastruktur sebelum melakukan perubahan. SageMaker AI menyebarkan model, wadah, atau instance baru dalam mode bayangan dan merutekan salinan permintaan inferensi secara real time dalam titik akhir yang sama. Anda dapat mencatat respons varian bayangan untuk perbandingan. Untuk detail tentang pengujian bayangan, lihatTes bayangan. Jika Anda memutuskan untuk melanjutkan dan mengubah model Anda, pagar pembatas penerapan membantu Anda mengontrol sakelar dari model saat ini ke model baru. Anda dapat memilih metode seperti pengujian biru/hijau atau kenari dari proses pergeseran lalu lintas untuk mempertahankan kontrol granular selama pembaruan. Untuk informasi tentang pagar pembatas penerapan, lihat. Pagar pembatas penyebaran untuk memperbarui model dalam produksi

Topik berikutnya:

Model Monitor

Topik sebelumnya:

Batasan
PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.