Comment créer un point de terminaison d'inférence asynchrone - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Comment créer un point de terminaison d'inférence asynchrone

Créez un point de terminaison asynchrone de la même manière que vous créeriez un point de terminaison à l'aide des services SageMaker d'hébergement :

  • Créez un modèle SageMaker avecCreateModel.

  • Créez une configuration de point de terminaison avec CreateEndpointConfig.

  • Créez un HTTPS point de terminaison avecCreateEndpoint.

Pour créer un point de terminaison, vous devez d'abord créer un modèle avec CreateModel, où vous pointez sur l'artefact du modèle et sur un chemin de registre Docker (Image). Vous créez ensuite une configuration à l'aide de CreateEndpointConfiglaquelle vous spécifiez un ou plusieurs modèles créés CreateModel API à l'aide de to deploy et des ressources que vous SageMaker souhaitez provisionner. Créez un point de terminaison avec CreateEndpoint à l'aide de la configuration de point de terminaison spécifiée dans la requête. Vous pouvez mettre à jour un point de terminaison asynchrone avec le. UpdateEndpointAPI Envoyez et recevez des requêtes d'inférence à partir du modèle hébergé sur le point de terminaison avec InvokeEndpointAsync. Vous pouvez supprimer vos points de terminaison à l'aide du DeleteEndpointAPI.

Pour une liste complète des SageMaker images disponibles, consultez Available Deep Learning Containers Images. Veuillez consulter Conteneurs avec code d'inférence personnalisé pour savoir comment créer votre image Docker.