Inferencia asíncrona - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Inferencia asíncrona

Amazon SageMaker Asynchronous Inference es una capacidad SageMaker que pone en cola las solicitudes entrantes y las procesa de forma asíncrona. Esta opción es ideal para solicitudes con cargas de gran tamaño (hasta 1 GB), tiempos de procesamiento prolongados (hasta una hora) y requisitos de latencia cercanos al tiempo real. La inferencia asíncrona le permite ahorrar costes al escalar automáticamente el número de instancias a cero cuando no hay solicitudes que procesar, de modo que solo paga cuando el punto de conexión procesa las solicitudes.

Cómo funciona

Crear un punto de conexión de inferencia asíncrono es similar a crear puntos de conexión de inferencia en tiempo real. Puede usar sus SageMaker modelos existentes y solo necesita especificar el AsyncInferenceConfig objeto al crear la configuración de su punto final con el campo de la API. EndpointConfig CreateEndpointConfig En el siguiente diagrama, se muestran la arquitectura y el flujo de trabajo de la inferencias asíncronas.

Diagrama de arquitectura de la inferencia asíncrona que muestra cómo un usuario invoca un punto final.

Para invocar el punto de conexión, debe colocar la carga útil de la solicitud en Amazon S3. También debe proporcionar un puntero a esta carga útil como parte de la solicitud. InvokeEndpointAsync Tras la invocación, pone en SageMaker cola la solicitud para su procesamiento y devuelve un identificador y una ubicación de salida como respuesta. Tras el procesamiento, SageMaker coloca el resultado en la ubicación de Amazon S3. Si lo desea, puede optar por recibir notificaciones de éxito o error con Amazon SNS. Para obtener más información acerca de cómo configurar las notificaciones asíncronas, consulte Revisar los resultados de predicciones.

nota

La presencia de un objeto de configuración de inferencia asíncrona (AsyncInferenceConfig) en la configuración del punto de conexión implica que este solo puede recibir invocaciones asíncronas.

¿Cómo puedo comenzar?

Si es la primera vez que utiliza Amazon SageMaker Asynchronous Inference, le recomendamos que haga lo siguiente:

Tenga en cuenta que, si el punto de conexión utiliza alguna de las características incluidas en esta página Exclusiones, no podrá utilizar la inferencia asíncrona.