Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Inferencia asíncrona
Amazon SageMaker Asynchronous Inference es una capacidad SageMaker que pone en cola las solicitudes entrantes y las procesa de forma asíncrona. Esta opción es ideal para solicitudes con cargas de gran tamaño (hasta 1 GB), tiempos de procesamiento prolongados (hasta una hora) y requisitos de latencia cercanos al tiempo real. La inferencia asíncrona le permite ahorrar costes al escalar automáticamente el número de instancias a cero cuando no hay solicitudes que procesar, de modo que solo paga cuando el punto de conexión procesa las solicitudes.
Cómo funciona
Crear un punto de conexión de inferencia asíncrono es similar a crear puntos de conexión de inferencia en tiempo real. Puede usar sus SageMaker modelos existentes y solo necesita especificar el AsyncInferenceConfig
objeto al crear la configuración de su punto final con el campo de la API. EndpointConfig
CreateEndpointConfig
En el siguiente diagrama, se muestran la arquitectura y el flujo de trabajo de la inferencias asíncronas.
Para invocar el punto de conexión, debe colocar la carga útil de la solicitud en Amazon S3. También debe proporcionar un puntero a esta carga útil como parte de la solicitud. InvokeEndpointAsync
Tras la invocación, pone en SageMaker cola la solicitud para su procesamiento y devuelve un identificador y una ubicación de salida como respuesta. Tras el procesamiento, SageMaker coloca el resultado en la ubicación de Amazon S3. Si lo desea, puede optar por recibir notificaciones de éxito o error con Amazon SNS. Para obtener más información acerca de cómo configurar las notificaciones asíncronas, consulte Revisar los resultados de predicciones.
nota
La presencia de un objeto de configuración de inferencia asíncrona (AsyncInferenceConfig
) en la configuración del punto de conexión implica que este solo puede recibir invocaciones asíncronas.
¿Cómo puedo comenzar?
Si es la primera vez que utiliza Amazon SageMaker Asynchronous Inference, le recomendamos que haga lo siguiente:
-
Lea Operaciones asíncronas de puntos finales para obtener información sobre cómo crear, invocar, actualizar y eliminar un punto de conexión asíncrono.
-
Consulte el cuaderno de ejemplo de inferencia asincrónica
en el repositorio aws/. amazon-sagemaker-examples GitHub
Tenga en cuenta que, si el punto de conexión utiliza alguna de las características incluidas en esta página Exclusiones, no podrá utilizar la inferencia asíncrona.