Comment créer un point de terminaison d'inférence asynchrone - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Comment créer un point de terminaison d'inférence asynchrone

Créez un point de terminaison asynchrone de la même manière que vous créeriez un point de terminaison à l'aide des services d'hébergement SageMaker AI :

  • Créez un modèle en SageMaker IA avecCreateModel.

  • Créez une configuration de point de terminaison avec CreateEndpointConfig.

  • Créez un point de terminaison HTTPS avec CreateEndpoint.

Pour créer un point de terminaison, vous devez d'abord créer un modèle avec CreateModel, où vous pointez sur l'artefact du modèle et sur un chemin de registre Docker (Image). Vous créez ensuite une configuration dans CreateEndpointConfiglaquelle vous spécifiez un ou plusieurs modèles créés à l'aide de l'CreateModelAPI pour le déploiement et les ressources que vous souhaitez que l' SageMaker IA fournisse. Créez un point de terminaison avec CreateEndpoint à l'aide de la configuration de point de terminaison spécifiée dans la requête. Vous pouvez mettre à jour un point de terminaison asynchrone avec l'API UpdateEndpoint. Envoyez et recevez des requêtes d'inférence à partir du modèle hébergé sur le point de terminaison avec InvokeEndpointAsync. Vous pouvez supprimer vos points de terminaison avec l'API DeleteEndpoint.

Pour une liste complète des images SageMaker AI disponibles, consultez Available Deep Learning Containers Images. Veuillez consulter Conteneurs avec code d'inférence personnalisé pour savoir comment créer votre image Docker.