Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Jenis dan Kerangka Instance yang Didukung
Amazon SageMaker Neo mendukung kerangka pembelajaran mendalam yang populer untuk kompilasi dan penerapan. Anda dapat menerapkan model Anda ke instance cloud atau jenis instans AWS Inferentia.
Berikut ini menjelaskan kerangka kerja yang didukung SageMaker Neo dan instance cloud target yang dapat Anda kompilasi dan terapkan. Untuk informasi tentang cara menerapkan model yang dikompilasi ke instans cloud atau Inferentia, lihat Menerapkan Model dengan Instans Cloud.
Instans Cloud
SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk CPU dan instance GPU cloud:
Kerangka Kerja | Versi Kerangka | Versi Model | Model | Format Model (dikemas dalam*.tar.gz) | Toolkit |
---|---|---|---|---|---|
MXNet | 1.8.0 | Mendukung 1.8.0 atau sebelumnya | Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas | Satu file simbol (.json) dan satu file parameter (.params) | GluonCV v0.8.0 |
ONNX | 1.7.0 | Mendukung 1.7.0 atau sebelumnya | Klasifikasi Gambar, SVM | Satu file model (.onnx) | |
Keras | 2.2.4 | Mendukung 2.2.4 atau sebelumnya | Klasifikasi Gambar | Satu file definisi model (.h5) | |
PyTorch | 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, atau 2.0 | Mendukung 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, dan 2.0 |
Klasifikasi Gambar Versi 1.13 dan 2.0 mendukung Object Detection, Vision Transformer, dan HuggingFace |
Satu file definisi model (.pt atau.pth) dengan input dtype float32 | |
TensorFlow | 1.15.3 atau 2.9 | Mendukung 1.15.3 dan 2.9 | Klasifikasi Gambar | Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel Untuk model beku, hanya satu file.pb atau .pbtxt |
|
XGBoost | 1.3.3 | Mendukung 1.3.3 atau sebelumnya | Pohon Keputusan | Satu file XGBoost model (.model) di mana jumlah node dalam pohon kurang dari 2 ^ 31 |
catatan
“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.
Tipe instans
Anda dapat menerapkan model yang SageMaker dikompilasi ke salah satu instance cloud yang tercantum di bawah ini:
Instans | Jenis Komputasi |
---|---|
|
Standar |
|
Standar |
|
Standar |
|
Standar |
|
Komputasi yang dipercepat |
|
Komputasi yang dipercepat |
|
Komputasi yang dipercepat |
Untuk informasi tentang vCPU, memori, dan harga per jam yang tersedia untuk setiap jenis instans, lihat SageMaker Harga Amazon
catatan
Saat mengompilasi ml_*
instance menggunakan PyTorch framework, gunakan bidang opsi Compiler di Output Configuration untuk memberikan tipe data (dtype
) yang benar dari input model.
Default diatur ke "float32"
.
AWS Inferensia
SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk Inf1:
Kerangka Kerja | Versi Kerangka | Versi Model | Model | Format Model (dikemas dalam*.tar.gz) | Toolkit |
---|---|---|---|---|---|
MXNet | 1,5 atau 1,8 | Mendukung 1,8, 1,5 dan sebelumnya | Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas | Satu file simbol (.json) dan satu file parameter (.params) | GluonCV v0.8.0 |
PyTorch | 1.7, 1.8 atau 1.9 | Mendukung 1.9 dan sebelumnya | Klasifikasi Gambar | Satu file definisi model (.pt atau.pth) dengan input dtype float32 | |
TensorFlow | 1.15 atau 2.5 | Mendukung 2.5, 1.15 dan sebelumnya | Klasifikasi Gambar | Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel Untuk model beku, hanya satu file.pb atau .pbtxt |
catatan
“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.
Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans Amazon Inf1 berbasis Inferensia AWS . EC2 AWS Inferentia adalah chip silikon kustom pertama Amazon yang dirancang untuk mempercepat pembelajaran mendalam. Saat ini, Anda dapat menggunakan ml_inf1
instance untuk menerapkan model yang dikompilasi.
AWS Inferensia2 dan Trainium AWS
Saat ini, Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans AWS Amazon EC2 Inf2 berbasis Inferensia2 (di Wilayah AS Timur (Ohio)), dan ke instans Amazon EC2 Trn1 AWS berbasis Train (di Wilayah AS Timur (Virginia Utara)). Untuk informasi lebih lanjut tentang model yang didukung pada instance ini, lihat Panduan Kesesuaian Arsitektur Model