Inferencia asíncrona

Amazon SageMaker Asynchronous Inference es una capacidad de la SageMaker IA que pone en cola las solicitudes entrantes y las procesa de forma asíncrona. Esta opción es ideal para solicitudes con cargas de gran tamaño (hasta 1 GB), tiempos de procesamiento prolongados (hasta una hora) y requisitos de latencia cercanos al tiempo real. La inferencia asíncrona le permite ahorrar costos al escalar automáticamente el número de instancias a cero cuando no hay solicitudes que procesar, de modo que solo paga cuando el punto de conexión procesa las solicitudes.

Cómo funciona

Crear un punto de conexión de inferencia asíncrono es similar a crear puntos de conexión de inferencia en tiempo real. Puede usar sus modelos de SageMaker IA existentes y solo necesita especificar el AsyncInferenceConfig objeto al crear la configuración de su punto final con el campo de la API. EndpointConfig CreateEndpointConfig En el siguiente diagrama, se muestran la arquitectura y el flujo de trabajo de la inferencias asíncronas.

Diagrama de arquitectura de la inferencia asíncrona, donde se observa que un usuario invoca un punto de conexión.

Para invocar el punto de conexión, debe colocar la carga útil de la solicitud en Amazon S3. También debe proporcionar un puntero a esta carga útil como parte de la solicitud de InvokeEndpointAsync. Tras la invocación, la SageMaker IA pone en cola la solicitud para su procesamiento y devuelve un identificador y una ubicación de salida como respuesta. Tras el procesamiento, la SageMaker IA coloca el resultado en la ubicación de Amazon S3. Si lo desea, puede optar por recibir notificaciones de éxito o error con Amazon SNS. Para obtener más información acerca de cómo configurar las notificaciones asíncronas, consulte Revisar los resultados de predicciones.

nota

La presencia de un objeto de configuración de inferencia asíncrona (AsyncInferenceConfig) en la configuración del punto de conexión implica que este solo puede recibir invocaciones asíncronas.

¿Cómo puedo comenzar?

Si es la primera vez que utiliza Amazon SageMaker Asynchronous Inference, le recomendamos que haga lo siguiente:

Lea Operaciones de punto de conexión asíncronas para obtener información sobre cómo crear, invocar, actualizar y eliminar un punto de conexión asíncrono.
Explore el cuaderno de ejemplos de inferencia asincrónica en el repositorio -sagemaker-examples. aws/amazon GitHub

Tenga en cuenta que, si el punto de conexión utiliza alguna de las características incluidas en esta página Exclusiones, no podrá utilizar la inferencia asíncrona.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Resolución de problemas

Operaciones de punto de conexión asíncronas