Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Trabajos de recomendación con Amazon SageMaker Inference Recommender
Amazon SageMaker Inference Recommender puede realizar dos tipos de recomendaciones:
-
Las recomendaciones de inferencia (tipo de trabajo
Default
) ejecutan un conjunto de pruebas de carga en los tipos de instancias recomendados. También puede realizar una prueba de carga para un punto de conexión sin servidor. Solo necesitas proporcionar un paquete modelo Amazon Resource Name (ARN) para lanzar este tipo de trabajo de recomendación. Los trabajos de recomendación de inferencia se completan en 45 minutos. -
Las recomendaciones de puntos de conexión (tipo de trabajo
Advanced
) se basan en una prueba de carga personalizada en la que se seleccionan las instancias de ML deseadas o un punto de conexión sin servidor, se proporciona un patrón de tráfico personalizado y se especifican los requisitos de latencia y rendimiento en función de los requisitos de producción. Este trabajo tarda una media de 2 horas en completarse, en función de la duración del trabajo establecida y del número total de configuraciones de inferencia probadas.
Ambos tipos de recomendaciones utilizan lo mismo APIs para crear, describir y detener trabajos. El resultado es una lista de recomendaciones de configuración de instancias con variables de entorno, costes, rendimiento y métricas de latencia asociadas. Los trabajos de recomendación también proporcionan un recuento inicial de instancias, que puede utilizar para configurar una política de escalado automático. Para diferenciar entre los dos tipos de trabajos, cuando cree un trabajo mediante la SageMaker consola o la consolaAPIs, especifique si desea Default
crear recomendaciones preliminares de puntos de conexión y Advanced
recomendaciones de puntos finales personalizadas.
nota
No necesita realizar ambos tipos de trabajos de recomendación en su propio flujo de trabajo. Puede realizar cualquiera de las dos de forma independiente.
El Recomendador de inferencias también puede proporcionarle una lista de posibles instancias o los cinco tipos de instancias principales optimizados en términos de costes, rendimiento y latencia para la implementación del modelo, junto con una puntuación de confianza. Puede elegir estas instancias al implementar su modelo. El Recomendador de inferencias realiza automáticamente una evaluación comparativa con su modelo para que usted pueda proporcionar las posibles instancias. Como se trata de recomendaciones preliminares, le recomendamos que ejecute más trabajos de recomendación de instancias para obtener resultados más precisos. Para ver las posibles instancias, vaya a la página de detalles del SageMaker modelo. Para obtener más información, consulte Obtener posibles instancias instantáneas.
Temas
- Obtener posibles instancias instantáneas
- Recomendaciones de inferencia
- Obtener una recomendación de inferencia para un punto de conexión existente
- Detener la recomendación de inferencia
- Recomendaciones recopiladas con Neo
- Resultados de las recomendaciones
- Obtener recomendaciones de políticas de escalado automático
- Ejecutar una prueba de carga personalizada
- Detener la prueba de carga
- Solucionar los errores del Recomendador de inferencias