Optimisation des performances des modèles avec SageMaker Neo

Mode de mise au point

Optimisation des performances des modèles avec SageMaker Neo - Amazon SageMaker AI

Qu'est-ce que SageMaker Neo ?Fonctionnement

Neo est une fonctionnalité d'Amazon SageMaker AI qui permet aux modèles d'apprentissage automatique de s'entraîner une seule fois et de fonctionner n'importe où dans le cloud et à la périphérie.

Si vous utilisez SageMaker Neo pour la première fois, nous vous recommandons de consulter la section Getting Started with Edge Devices pour obtenir des step-by-step instructions sur la compilation et le déploiement sur un appareil Edge.

Qu'est-ce que SageMaker Neo ?

Généralement, il est difficile d'optimiser des modèles de machine learning pour l'inférence sur plusieurs plateformes, car vous devez régler manuellement ces modèles en fonction de la configuration matérielle et logicielle de chaque plateforme. Si vous voulez obtenir des performances optimales pour une application donnée, vous devez connaître certains facteurs comme l'architecture matérielle, l'ensemble d'instructions, les modèles d'accès à la mémoire et les formes de données d'entrée. Pour le développement logiciel traditionnel, des outils tels que des compilateurs et des profileurs simplifient le processus. Pour le machine learning, la plupart des outils sont propres au framework ou au matériel. Cela vous oblige à recourir à un trial-and-error processus manuel peu fiable et improductif.

Neo optimise automatiquement les modèles Gluon, Keras,, MXNet, PyTorch TensorFlow, TensorFlow -Lite et ONNX pour l'inférence sur les machines Android, Linux et Windows basés sur des processeurs d'Ambarella, ARM, Intel, Nvidia, NXP, Qualcomm, Texas Instruments et Xilinx. Neo est testé avec des modèles de vision par ordinateur disponibles dans les zoos modèles de tous les frameworks. SageMaker Neo prend en charge la compilation et le déploiement pour deux plateformes principales : les instances cloud (y compris Inferentia) et les appareils périphériques.

Pour de plus amples informations sur les cadres pris en charge et les types d'instances cloud dans lesquels vous pouvez déployer, veuillez consulter Cadres et types d'instance pris en charge pour les instances cloud.

Pour plus d'informations sur les frameworks pris en charge, les appareils Edge, les systèmes d'exploitation, les architectures de puces et les modèles d'apprentissage automatique courants testés par SageMaker AI Neo pour les appareils Edge, voir Cadres, périphériques, systèmes et architectures pris en charge pour les appareils Edge.

Fonctionnement

Neo est composé d'un compilateur et d'un environnement d'exécution. D'abord, l'API de compilateur Neo lit les modèles exportés depuis diverses infrastructures. Il convertit les fonctions et opérations spécifiques au cadre en une représentation intermédiaire agnostique de cadre. Ensuite, il effectue une série d'optimisations. Ensuite, il génère le code binaire pour les opérations optimisées, les écrit dans une bibliothèque d'objets partagés, et enregistre la définitions et les paramètres du modèle dans des fichiers séparés. Neo fournit également un environnement d'exécution pour chaque plateforme cible qui charge et exécute le modèle compilé.

Comment fonctionne Neo dans le domaine de SageMaker l'IA.

Vous pouvez créer une tâche de compilation Neo à partir de la console SageMaker AI, du AWS Command Line Interface (AWS CLI), d'un bloc-notes Python ou du SDK SageMaker AI. Pour plus d'informations sur la compilation d'un modèle, consultez. Compilation de modèles avec Neo Avec quelques commandes CLI, un appel d'API ou quelques clics, vous pouvez convertir un modèle pour la plateforme de votre choix. Vous pouvez déployer rapidement le modèle sur un point de terminaison d' SageMaker IA ou sur un AWS IoT Greengrass appareil.

Neo peut optimiser les modèles avec des paramètres en termes de largeur FP32 ou de largeur FP16 binaire, quantifiés INT8 ou quantifiés.

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

SageMaker Fin de vie d'Edge Manager

Compilez des modèles

Rubrique suivante :

Compilez des modèles

Rubrique précédente :

SageMaker Fin de vie d'Edge Manager

Avez-vous besoin d’aide ?

Sur cette page

Sélectionner vos préférences de cookies

Personnaliser les préférences de cookies

Essentiels

Performances

Fonctionnels

Publicitaires

Impossible d'enregistrer les préférences concernant les cookies