Jenis dan Kerangka Instance yang Didukung - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Jenis dan Kerangka Instance yang Didukung

Amazon SageMaker Neo mendukung kerangka pembelajaran mendalam yang populer untuk kompilasi dan penerapan. Anda dapat menerapkan model Anda ke instance cloud atau jenis instans AWS Inferentia.

Berikut ini menjelaskan kerangka kerja yang didukung SageMaker Neo dan instance cloud target yang dapat Anda kompilasi dan terapkan. Untuk informasi tentang cara menerapkan model yang dikompilasi ke instans cloud atau Inferentia, lihat Menerapkan Model dengan Instans Cloud.

Instans Cloud

SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk CPU dan instance GPU cloud:

Kerangka Kerja Versi Kerangka Versi Model Model Format Model (dikemas dalam*.tar.gz) Toolkit
MXNet 1.8.0 Mendukung 1.8.0 atau sebelumnya Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas Satu file simbol (.json) dan satu file parameter (.params) GluonCV v0.8.0
ONNX 1.7.0 Mendukung 1.7.0 atau sebelumnya Klasifikasi Gambar, SVM Satu file model (.onnx)
Keras 2.2.4 Mendukung 2.2.4 atau sebelumnya Klasifikasi Gambar Satu file definisi model (.h5)
PyTorch 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, atau 2.0 Mendukung 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, dan 2.0

Klasifikasi Gambar

Versi 1.13 dan 2.0 mendukung Object Detection, Vision Transformer, dan HuggingFace

Satu file definisi model (.pt atau.pth) dengan input dtype float32
TensorFlow 1.15.3 atau 2.9 Mendukung 1.15.3 dan 2.9 Klasifikasi Gambar

Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel

Untuk model beku, hanya satu file.pb atau .pbtxt

XGBoost 1.3.3 Mendukung 1.3.3 atau sebelumnya Pohon Keputusan Satu file XGBoost model (.model) di mana jumlah node dalam pohon kurang dari 2 ^ 31
catatan

“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.

Tipe instans

Anda dapat menerapkan model yang SageMaker dikompilasi ke salah satu instance cloud yang tercantum di bawah ini:

Instans Jenis Komputasi

ml_c4

Standar

ml_c5

Standar

ml_m4

Standar

ml_m5

Standar

ml_p2

Komputasi yang dipercepat

ml_p3

Komputasi yang dipercepat

ml_g4dn

Komputasi yang dipercepat

Untuk informasi tentang vCPU, memori, dan harga per jam yang tersedia untuk setiap jenis instans, lihat SageMaker Harga Amazon.

catatan

Saat mengompilasi ml_* instance menggunakan PyTorch framework, gunakan bidang opsi Compiler di Output Configuration untuk memberikan tipe data (dtype) yang benar dari input model.

Default diatur ke "float32".

AWS Inferensia

SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk Inf1:

Kerangka Kerja Versi Kerangka Versi Model Model Format Model (dikemas dalam*.tar.gz) Toolkit
MXNet 1,5 atau 1,8 Mendukung 1,8, 1,5 dan sebelumnya Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas Satu file simbol (.json) dan satu file parameter (.params) GluonCV v0.8.0
PyTorch 1.7, 1.8 atau 1.9 Mendukung 1.9 dan sebelumnya Klasifikasi Gambar Satu file definisi model (.pt atau.pth) dengan input dtype float32
TensorFlow 1.15 atau 2.5 Mendukung 2.5, 1.15 dan sebelumnya Klasifikasi Gambar

Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel

Untuk model beku, hanya satu file.pb atau .pbtxt

catatan

“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.

Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans Amazon Inf1 berbasis Inferensia AWS . EC2 AWS Inferentia adalah chip silikon kustom pertama Amazon yang dirancang untuk mempercepat pembelajaran mendalam. Saat ini, Anda dapat menggunakan ml_inf1 instance untuk menerapkan model yang dikompilasi.

AWS Inferensia2 dan Trainium AWS

Saat ini, Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans AWS Amazon EC2 Inf2 berbasis Inferensia2 (di Wilayah AS Timur (Ohio)), dan ke instans Amazon EC2 Trn1 AWS berbasis Train (di Wilayah AS Timur (Virginia Utara)). Untuk informasi lebih lanjut tentang model yang didukung pada instance ini, lihat Panduan Kesesuaian Arsitektur Model dalam dokumentasi AWS Neuron, dan contoh di repositori Neuron Github.