Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Comment créer un point de terminaison d'inférence asynchrone
Créez un point de terminaison asynchrone de la même manière que vous créeriez un point de terminaison à l'aide des services SageMaker d'hébergement :
Créez un modèle SageMaker avec
CreateModel
.Créez une configuration de point de terminaison avec
CreateEndpointConfig
.Créez un HTTPS point de terminaison avec
CreateEndpoint
.
Pour créer un point de terminaison, vous devez d'abord créer un modèle avec CreateModel
, où vous pointez sur l'artefact du modèle et sur un chemin de registre Docker (Image). Vous créez ensuite une configuration à l'aide de CreateEndpointConfig
laquelle vous spécifiez un ou plusieurs modèles créés CreateModel
API à l'aide de to deploy et des ressources que vous SageMaker souhaitez provisionner. Créez un point de terminaison avec CreateEndpoint
à l'aide de la configuration de point de terminaison spécifiée dans la requête. Vous pouvez mettre à jour un point de terminaison asynchrone avec le. UpdateEndpoint
API Envoyez et recevez des requêtes d'inférence à partir du modèle hébergé sur le point de terminaison avec InvokeEndpointAsync
. Vous pouvez supprimer vos points de terminaison à l'aide du DeleteEndpoint
API.
Pour une liste complète des SageMaker images disponibles, consultez Available Deep Learning Containers Images