Inferencia en tiempo real - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Inferencia en tiempo real

La inferencia en tiempo real es idónea para cargas de trabajo de inferencia con requisitos en tiempo real, interactivos y de baja latencia. Puede implementar su modelo en los servicios de alojamiento de SageMaker IA y obtener un punto final que pueda usarse como inferencia. Estos puntos de conexión están totalmente gestionados y admiten autoescalado (consulte Escalado automático de los modelos de Amazon SageMaker AI).