Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Invocar un punto de conexión asíncrono
Obtenga inferencias del modelo alojado en su punto de conexión asíncrono con InvokeEndpointAsync
.
nota
Si aún no lo ha hecho, cargue sus datos de inferencia (como el modelo de machine learning o los datos de muestra) en Amazon S3.
Especifique los siguientes campos en su solicitud:
En
InputLocation
, especifique la ubicación de los datos de inferencia.En
EndpointName
, especifique el nombre del punto de conexión.En
InvocationTimeoutSeconds
, puede establecer el tiempo de espera máximo para las solicitudes (opcional). Puede establecer este valor en un máximo de 3600 segundos (una hora) por solicitud. Si no especifica este campo en la solicitud, el tiempo de espera de la solicitud será de 15 minutos de forma predeterminada.
# Create a low-level client representing Amazon SageMaker Runtime sagemaker_runtime = boto3.client("sagemaker-runtime", region_name=
<aws_region>
) # Specify the location of the input. Here, a single SVM sample input_location ="s3://bucket-name/test_point_0.libsvm"
# The name of the endpoint. The name must be unique within an AWS Region in your AWS account. endpoint_name='<endpoint-name>'
# After you deploy a model into production using SageMaker AI hosting # services, your client applications use this API to get inferences # from the model hosted at the specified endpoint. response = sagemaker_runtime.invoke_endpoint_async( EndpointName=endpoint_name, InputLocation=input_location, InvocationTimeoutSeconds=3600)
Recibirá una respuesta en forma de JSON cadena con su ID de solicitud y el nombre del bucket de Amazon S3 que recibirá la respuesta a la API llamada una vez que se procese.