Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Algoritma, kerangka kerja, dan instance yang didukung untuk titik akhir multi-model
Untuk informasi tentang algoritme, kerangka kerja, dan jenis instance yang dapat Anda gunakan dengan titik akhir multi-model, lihat bagian berikut.
Algoritme, kerangka kerja, dan instance yang didukung untuk titik akhir multi-model menggunakan instance yang didukung CPU
Wadah inferensi untuk algoritme dan kerangka kerja berikut mendukung titik akhir multi-model:
Untuk menggunakan kerangka kerja atau algoritme lain, gunakan toolkit SageMaker inferensi untuk membangun wadah yang mendukung titik akhir multi-model. Untuk informasi, lihat Bangun Container Anda Sendiri untuk Titik Akhir SageMaker Multi-Model.
Titik akhir multi-model mendukung semua jenis CPU instance.
Algoritme, kerangka kerja, dan instance yang didukung untuk titik akhir multi-model menggunakan instance yang didukung GPU
Hosting beberapa model GPU yang didukung pada titik akhir multi-model didukung melalui server Inferensi SageMaker Triton. Ini mendukung semua kerangka inferensi utama sepertiĀ® NVIDIA TensorRTā¢,,, Python,,, RandomForest scikit-learn PyTorch,MXNet, Open, custom C++ ONNXXGBoost, dan banyak lagi. VINO
Untuk menggunakan kerangka kerja atau algoritma lain, Anda dapat menggunakan backend Triton untuk Python atau C ++ untuk menulis logika model Anda dan melayani model kustom apa pun. Setelah server siap, Anda dapat mulai menerapkan 100-an model Deep Learning di belakang satu titik akhir.
Titik akhir multi-model mendukung jenis GPU instance berikut:
Keluarga instans | Jenis instans | vCPUs | GiB memori per v CPU | GPUs | GPUmemori |
---|---|---|---|---|---|
p2 |
ml.p2.xlarge |
4 |
15.25 |
1 |
12 |
p3 |
ml.p3.2xlarge |
8 |
7.62 |
1 |
16 |
g5 |
ml.g5.xlarge |
4 |
4 |
1 |
24 |
g5 |
ml.g5.2xbesar |
8 |
4 |
1 |
24 |
g5 |
ml.g5.4xbesar |
16 |
4 |
1 |
24 |
g5 |
ml.g5.8xbesar |
32 |
4 |
1 |
24 |
g5 |
ml.g5.16xbesar |
64 |
4 |
1 |
24 |
g4dn |
ml.g4dn.xlarge |
4 |
4 |
1 |
16 |
g4dn |
ml.g4dn.2xbesar |
8 |
4 |
1 |
16 |
g4dn |
ml.g4dn.4xbesar |
16 |
4 |
1 |
16 |
g4dn |
ml.g4dn.8xlarge |
32 |
4 |
1 |
16 |
g4dn |
ml.g4dn.16xlarge |
64 |
4 |
1 |
16 |