Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Penskalaan otomatis model Amazon SageMaker
Amazon SageMaker mendukung penskalaan otomatis (penskalaan otomatis) untuk model yang Anda hosting. Penskalaan otomatis secara dinamis menyesuaikan jumlah instance yang disediakan untuk model sebagai respons terhadap perubahan beban kerja Anda. Saat beban kerja meningkat, penskalaan otomatis menghadirkan lebih banyak instance online. Ketika beban kerja berkurang, penskalaan otomatis akan menghapus instans yang tidak perlu sehingga Anda tidak membayar instans yang disediakan yang tidak Anda gunakan.
Topik
- Ikhtisar kebijakan penskalaan otomatis
- Prasyarat penskalaan otomatis
- Konfigurasikan penskalaan otomatis model dengan konsol
- Daftarkan model
- Menentukan kebijakan penskalaan
- Menerapkan kebijakan penskalaan
- Petunjuk untuk mengedit kebijakan penskalaan
- Matikan sementara kebijakan penskalaan
- Menghapus kebijakan penskalaan
- Memeriksa status aktivitas penskalaan dengan menjelaskan aktivitas penskalaan
- Memuat pengujian konfigurasi penskalaan otomatis Anda
- Gunakan AWS CloudFormation untuk membuat kebijakan penskalaan
- Perbarui titik akhir yang menggunakan penskalaan otomatis
- Hapus titik akhir yang dikonfigurasi untuk penskalaan otomatis