Invocación de un punto de conexión sin servidor - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Invocación de un punto de conexión sin servidor

Para realizar una inferencia mediante un punto final sin servidor, debe enviar una HTTP solicitud al punto final. Puede usar el InvokeEndpointAPIo el AWS CLI, que realizan una POST solicitud para invocar su punto final. El tamaño máximo de carga útil de solicitud y respuesta para las invocaciones sin servidor es de 4 MB. Para puntos de conexión sin servidor:

  • El modelo debería descargarse y el servidor debería responder correctamente a /ping en un plazo de 3 minutos.

  • El tiempo de espera para que el contenedor responda a las solicitudes de inferencia de /invocations es de 1 minuto.

Invocar un punto de conexión

En el siguiente ejemplo, se utiliza AWS SDKpara Python (Boto3) para llamar a. InvokeEndpointAPI Tenga en cuenta que, a diferencia de las demás API llamadas de esta guíaInvokeEndpoint, for debe utilizar SageMaker Runtime Runtime como cliente. Especifique los siguientes valores:

  • En endpoint_name, utilice el nombre del punto de conexión sin servidor en servicio que quiera invocar.

  • Para content_type ello, especifique el MIME tipo de datos de entrada en el cuerpo de la solicitud (por ejemplo,application/json).

  • En payload, utilice la carga útil de la solicitud como inferencia. Su carga útil debe estar en bytes o un objeto similar a un archivo.

runtime = boto3.client("sagemaker-runtime") endpoint_name = "<your-endpoint-name>" content_type = "<request-mime-type>" payload = <your-request-body> response = runtime.invoke_endpoint( EndpointName=endpoint_name, ContentType=content_type, Body=payload )