Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Di Amazon SageMaker Canvas, Anda dapat menerapkan model Anda ke titik akhir untuk membuat prediksi. SageMaker AI menyediakan infrastruktur ML bagi Anda untuk meng-host model Anda pada titik akhir dengan instans komputasi yang Anda pilih. Kemudian, Anda dapat memanggil titik akhir (mengirim permintaan prediksi) dan mendapatkan prediksi waktu nyata dari model Anda. Dengan fungsi ini, Anda dapat menggunakan model Anda dalam produksi untuk menanggapi permintaan yang masuk, dan Anda dapat mengintegrasikan model Anda dengan aplikasi dan alur kerja yang ada.
Untuk memulai, Anda harus memiliki model yang ingin Anda terapkan. Anda dapat menerapkan versi model khusus yang telah Anda buat, model SageMaker JumpStart fondasi Amazon, dan model fondasi yang disetel JumpStart dengan baik. Untuk informasi selengkapnya tentang membuat model di Canvas, lihatCara kerja model kustom. Untuk informasi lebih lanjut tentang model JumpStart foundation di Canvas, lihatModel fondasi AI generatif di Kanvas SageMaker .
Tinjau bagian Manajemen izin berikut, lalu mulailah membuat penerapan baru di bagian Menerapkan model.
Manajemen izin
Secara default, Anda memiliki izin untuk menerapkan model ke titik akhir SageMaker AI Hosting. SageMaker AI memberikan izin ini untuk semua profil pengguna Canvas baru dan yang sudah ada melalui AmazonSageMakerCanvasFullAccesskebijakan, yang dilampirkan ke peran eksekusi AWS IAM untuk domain SageMaker AI yang menghosting aplikasi Canvas Anda.
Jika administrator Canvas Anda menyiapkan domain atau profil pengguna baru, saat mereka menyiapkan domain dan mengikuti petunjuk prasyarat diPrasyarat untuk menyiapkan Amazon Canvas SageMaker , SageMaker AI mengaktifkan izin penerapan model melalui opsi Aktifkan penerapan langsung model Canvas, yang diaktifkan secara default.
Administrator Canvas dapat mengelola izin penerapan model di tingkat profil pengguna juga. Misalnya, jika administrator tidak ingin memberikan izin penerapan model ke semua profil pengguna saat menyiapkan domain, mereka dapat memberikan izin kepada pengguna tertentu setelah membuat domain.
Prosedur berikut menunjukkan cara memodifikasi izin penerapan model untuk profil pengguna tertentu:
-
Buka konsol SageMaker AI di https://console.aws.amazon.com/sagemaker/
. -
Di panel navigasi kiri, pilih Konfigurasi admin.
-
Di bawah Konfigurasi Admin, pilih Domain.
-
Dari daftar domain, pilih domain profil pengguna.
-
Pada halaman Detail domain, pilih tab Profil pengguna.
-
Pilih profil pengguna Anda.
-
Pada halaman profil pengguna, pilih tab Konfigurasi Aplikasi.
-
Di bagian Canvas, pilih Edit.
-
Di bagian konfigurasi Ops Ops, aktifkan sakelar Aktifkan penerapan langsung model Canvas untuk mengaktifkan izin penerapan.
-
Pilih Kirim untuk menyimpan perubahan pada pengaturan domain Anda.
Profil pengguna sekarang harus memiliki izin penerapan model.
Setelah memberikan izin ke domain atau profil pengguna, pastikan pengguna keluar dari aplikasi Canvas mereka dan masuk kembali untuk menerapkan perubahan izin.
Menyebarkan model
Untuk memulai penerapan model Anda, Anda membuat penerapan baru di Canvas dan menentukan versi model yang ingin Anda terapkan bersama dengan infrastruktur ML, seperti jenis dan jumlah instance komputasi yang ingin Anda gunakan untuk hosting model.
Canvas menyarankan jenis default dan jumlah instans berdasarkan jenis model Anda, atau Anda dapat mempelajari lebih lanjut tentang berbagai jenis instans SageMaker AI di halaman harga Amazon SageMaker AI
Saat menerapkan model JumpStart pondasi, Anda juga memiliki opsi untuk menentukan lamanya waktu penerapan. Anda dapat menerapkan model ke titik akhir tanpa batas waktu (artinya titik akhir aktif hingga Anda menghapus penerapan). Atau, jika Anda hanya memerlukan titik akhir untuk waktu yang singkat dan ingin mengurangi biaya, Anda dapat menerapkan model ke titik akhir untuk jangka waktu tertentu, setelah itu SageMaker AI mematikan titik akhir untuk Anda.
catatan
Jika Anda menerapkan model untuk jangka waktu tertentu, tetap login ke aplikasi Canvas selama durasi titik akhir. Jika Anda keluar dari atau menghapus aplikasi, maka Canvas tidak dapat mematikan titik akhir pada waktu yang ditentukan.
Setelah model Anda diterapkan ke titik akhir inferensi real-time Hosting SageMaker AI Hosting, Anda dapat mulai membuat prediksi dengan memanggil titik akhir.
Ada beberapa cara berbeda bagi Anda untuk menerapkan model dari aplikasi Canvas. Anda dapat mengakses opsi penerapan model melalui salah satu metode berikut:
-
Pada halaman Model saya dari aplikasi Canvas, pilih model yang ingin Anda terapkan. Kemudian, dari halaman Versi model, pilih ikon Opsi lainnya (
) di sebelah versi model dan pilih Deploy.
-
Saat berada di halaman detail untuk versi model, pada tab Analisis, pilih opsi Deploy.
-
Saat berada di halaman detail untuk versi model, pada tab Predict, pilih ikon More options (
) di bagian atas halaman dan pilih Deploy.
-
Pada halaman Ops Ops aplikasi Canvas, pilih tab Deployments dan kemudian pilih Create deployment.
-
Untuk model JumpStart pondasi dan model pondasi yang disetel dengan baik, buka halaman Ready-to-use model aplikasi Canvas. Pilih Menghasilkan, mengekstrak, dan meringkas konten. Kemudian, temukan model JumpStart pondasi atau model pondasi yang disetel dengan baik yang ingin Anda terapkan. Pilih model, dan pada halaman obrolan model, pilih tombol Deploy.
Semua metode ini membuka panel samping model Deploy, tempat Anda menentukan konfigurasi penerapan untuk model Anda. Untuk menerapkan model dari panel ini, lakukan hal berikut:
-
(Opsional) Jika Anda membuat penerapan dari halaman Ops Ops, Anda akan memiliki opsi untuk Pilih model dan versi. Gunakan menu tarik-turun untuk memilih model dan versi model yang ingin Anda terapkan.
-
Masukkan nama di bidang Nama Deployment.
-
(Hanya untuk model JumpStart pondasi dan model pondasi yang disetel dengan baik) Pilih panjang Deployment. Pilih Tidak terbatas untuk membiarkan titik akhir aktif sampai Anda mematikannya, atau pilih Tentukan panjang dan kemudian masukkan periode waktu yang Anda inginkan titik akhir tetap aktif.
-
Untuk tipe Instance, SageMaker AI mendeteksi jenis dan nomor instans default yang sesuai untuk model Anda. Namun, Anda dapat mengubah jenis instance yang ingin Anda gunakan untuk menghosting model Anda.
catatan
Jika Anda kehabisan kuota instans untuk jenis instans yang dipilih di AWS akun Anda, Anda dapat meminta peningkatan kuota. Untuk informasi selengkapnya tentang kuota default dan cara meminta peningkatan, lihat titik akhir dan kuota Amazon SageMaker AI di panduan Referensi AWS Umum.
-
Untuk hitungan Instance, Anda dapat mengatur jumlah instans aktif yang digunakan untuk titik akhir Anda. SageMaker AI mendeteksi nomor default yang cocok untuk model Anda, tetapi Anda dapat mengubah nomor ini.
-
Saat Anda siap untuk menerapkan model Anda, pilih Deploy.
Model Anda sekarang harus diterapkan ke titik akhir.