Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Inferencia asíncrona

Modo de enfoque
Inferencia asíncrona - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon SageMaker Asynchronous Inference es una capacidad de la SageMaker IA que pone en cola las solicitudes entrantes y las procesa de forma asíncrona. Esta opción es ideal para solicitudes con cargas de gran tamaño (hasta 1 GB), tiempos de procesamiento prolongados (hasta una hora) y requisitos de latencia cercanos al tiempo real. La inferencia asíncrona le permite ahorrar costes al escalar automáticamente el número de instancias a cero cuando no hay solicitudes que procesar, de modo que solo paga cuando el punto de conexión procesa las solicitudes.

Cómo funciona

Crear un punto de conexión de inferencia asíncrono es similar a crear puntos de conexión de inferencia en tiempo real. Puede usar sus modelos de SageMaker IA existentes y solo necesita especificar el AsyncInferenceConfig objeto al crear la configuración de su punto final con el campo de la API. EndpointConfig CreateEndpointConfig En el siguiente diagrama, se muestran la arquitectura y el flujo de trabajo de la inferencias asíncronas.

Diagrama de arquitectura de la inferencia asíncrona, donde se observa que un usuario invoca un punto de conexión.

Para invocar el punto de conexión, debe colocar la carga útil de la solicitud en Amazon S3. También debe proporcionar un puntero a esta carga útil como parte de la solicitud de InvokeEndpointAsync. Tras la invocación, la SageMaker IA pone en cola la solicitud para su procesamiento y devuelve un identificador y una ubicación de salida como respuesta. Tras el procesamiento, la SageMaker IA coloca el resultado en la ubicación de Amazon S3. Si lo desea, puede optar por recibir notificaciones de éxito o error con Amazon SNS. Para obtener más información acerca de cómo configurar las notificaciones asíncronas, consulte Revisar los resultados de predicciones.

nota

La presencia de un objeto de configuración de inferencia asíncrona (AsyncInferenceConfig) en la configuración del punto de conexión implica que este solo puede recibir invocaciones asíncronas.

¿Cómo puedo comenzar?

Si es la primera vez que utiliza Amazon SageMaker Asynchronous Inference, le recomendamos que haga lo siguiente:

Tenga en cuenta que, si el punto de conexión utiliza alguna de las características incluidas en esta página Exclusiones, no podrá utilizar la inferencia asíncrona.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.