Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Appeler un point de terminaison asynchrone
Obtenez des inférences du modèle hébergé sur votre point de terminaison asynchrone avec InvokeEndpointAsync
.
Note
Si vous ne l'avez pas déjà fait, téléchargez vos données d'inférence (par exemple, modèle de machine learning, exemples de données) sur Amazon S3.
Renseignez les champs suivants dans votre demande :
Pour
InputLocation
, spécifiez l'emplacement de vos données d'inférence.Pour
EndpointName
, spécifiez le nom de votre point de terminaison.(Facultatif) Pour
InvocationTimeoutSeconds
, vous pouvez définir le délai d'attente maximal des demandes. Vous pouvez définir cette valeur sur un maximum de 3 600 secondes (une heure) par demande. Si vous ne spécifiez pas ce champ dans votre demande, la demande expire par défaut après 15 minutes.
# Create a low-level client representing Amazon SageMaker Runtime sagemaker_runtime = boto3.client("sagemaker-runtime", region_name=
<aws_region>
) # Specify the location of the input. Here, a single SVM sample input_location ="s3://bucket-name/test_point_0.libsvm"
# The name of the endpoint. The name must be unique within an AWS Region in your AWS account. endpoint_name='<endpoint-name>'
# After you deploy a model into production using SageMaker hosting # services, your client applications use this API to get inferences # from the model hosted at the specified endpoint. response = sagemaker_runtime.invoke_endpoint_async( EndpointName=endpoint_name, InputLocation=input_location, InvocationTimeoutSeconds=3600)
Vous recevez une réponse sous forme de JSON chaîne avec votre ID de demande et le nom du compartiment Amazon S3 qui recevra la réponse à l'APIappel une fois celui-ci traité.