Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Inferencia en tiempo real
La inferencia en tiempo real es idónea para cargas de trabajo de inferencia con requisitos en tiempo real, interactivos y de baja latencia. Puede implementar su modelo en los servicios de alojamiento de SageMaker IA y obtener un punto final que pueda usarse como inferencia. Estos puntos de conexión están totalmente gestionados y admiten autoescalado (consulte Escalado automático de los modelos de Amazon SageMaker AI).
Temas
- Implementación de modelos para inferencia en tiempo real
- Invocación de modelos para realizar inferencias en tiempo real
- puntos de conexión
- Opciones de alojamiento
- Escalado automático de los modelos de Amazon SageMaker AI
- Volúmenes de almacén de instancias
- Validación de modelos en producción
- Explicabilidad en línea con Clarify SageMaker
- Ajuste los modelos con componentes de inferencia del adaptador