Déploiement et prédiction des modèles Autopilot - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déploiement et prédiction des modèles Autopilot

Ce guide Amazon SageMaker Autopilot décrit les étapes relatives au déploiement du modèle, à la configuration de l'inférence en temps réel et à l'exécution de l'inférence avec des tâches par lots.

Après avoir entraîné vos modèles Autopilot, vous pouvez les déployer pour obtenir des prédictions de deux manières différentes :

  1. Utilisez Déployez des modèles pour une inférence en temps réel pour configurer un point de terminaison et obtenir des prévisions de manière interactive. L'inférence en temps réel est idéale pour les charges de travail d'inférence où vous avez des exigences en temps réel, interactives et à faible latence.

  2. Utilisez Exécuter des tâches d'inférence par lots pour faire des prévisions en parallèle sur des lots d'observations sur l'ensemble d'un jeu de données. L'inférence par lots est une bonne option pour les grands jeux de données, ou si vous n'avez pas besoin d'une réponse immédiate à une demande de prédiction de modèle.

Note

Pour éviter des frais inutiles, lorsque vous n'avez plus besoin des points de terminaison et des ressources créés lors du déploiement du modèle, vous pouvez les supprimer. Pour plus d'informations sur la tarification des instances par région, consultez Amazon SageMaker Pricing.