Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Emplois de recommandation avec Amazon SageMaker Inference Recommender
Amazon SageMaker Inference Recommender peut émettre deux types de recommandations :
-
Les recommandations d'instances (type de tâche
Default
) exécutent un ensemble de tests de charge sur les types d'instances recommandés. Vous pouvez également effectuer un test de charge pour un point de terminaison sans serveur. Il vous suffit de fournir un modèle de package Amazon Resource Name (ARN) pour lancer ce type de tâche de recommandation. Les tâches de recommandation d'inférence sont terminées en 45 minutes. -
Les recommandations de point de terminaison (type de tâche
Advanced
) sont basées sur un test de charge personnalisé dans lequel vous sélectionnez les instances de machine learning que vous voulez ou un point de terminaison sans serveur, fournissez un modèle de trafic personnalisé et des exigences de latence et de débit en fonction de vos exigences de production. Cette tâche dure en moyenne 2 heures en fonction de la durée de la tâche définie et du nombre total de configurations d'inférences testées.
Les deux types de recommandations utilisent la même APIs méthode pour créer, décrire et arrêter des tâches. La sortie est une liste de recommandations de configuration d'instance avec les variables d'environnement associées, les métriques de coût, de débit et de latence. Les tâches de recommandation fournissent également un nombre initial d'instances, que vous pouvez utiliser pour configurer une politique de dimensionnement automatique. Pour différencier les deux types de tâches, lorsque vous créez une tâche via la SageMaker console ou le, spécifiez de créer des recommandations préliminaires sur les points Default
de terminaisonAPIs, des tests de charge personnalisés et Advanced
des recommandations de point de terminaison.
Note
Vous n'avez pas besoin d'effectuer les deux types de tâches de recommandation dans votre propre flux de travail. Vous pouvez faire l'une indépendamment de l'autre.
Inference Recommender peut également vous fournir une liste d'instances potentielles, ou les cinq principaux types d'instances optimisés en termes de coût, de débit et de latence pour le déploiement du modèle, ainsi qu'un score de confiance. Vous pouvez choisir ces instances lors du déploiement de votre modèle. Inference Recommender effectue automatiquement une analyse comparative par rapport à votre modèle afin que vous puissiez fournir les instances potentielles. Comme il s'agit de recommandations préliminaires, nous vous recommandons d'exécuter d'autres tâches de recommandation d'instance pour obtenir des résultats plus précis. Pour consulter les instances potentielles, rendez-vous sur la page de détails de votre SageMaker modèle. Pour de plus amples informations, veuillez consulter Obtention d'instances potentielles instantanées.
Rubriques
- Obtention d'instances potentielles instantanées
- Recommandations d'inférence
- Obtention d'une recommandation d'inférence pour un point de terminaison existant
- Arrêt de votre recommandation d'inférence
- Recommandations compilées avec Neo
- Résultats des recommandations
- Obtention de recommandations en matière de politique de mise à l'échelle automatique
- Exécuter un test de charge personnalisé
- Arrêt de votre test de charge
- Résolution des erreurs Inference Recommender