Obtener posibles instancias instantáneas

Inference Recommender también puede proporcionarle una lista de posibles instancias, o tipos de instancias que podrían ser adecuados para su modelo, en la página de detalles de su modelo de SageMaker IA. El Recomendador de inferencias realiza automáticamente una evaluación comparativa preliminar con su modelo para proporcionarle las cinco instancias más probables. Como se trata de recomendaciones preliminares, le recomendamos que ejecute más trabajos de recomendación de instancias para obtener resultados más precisos.

Puede ver una lista de posibles instancias para su modelo mediante programación mediante la DescribeModelAPI, el SDK de SageMaker Python o la consola de SageMaker IA.

nota

No obtendrás instancias prospectivas para los modelos que creaste en SageMaker IA antes de que esta función estuviera disponible.

Para ver las posibles instancias del modelo a través de la consola, haga lo siguiente:

Ve a la SageMaker consola en https://console.aws.amazon.com/sagemaker/.
En el panel de navegación, elija Inferencia y a continuación elija Modelos.
En la lista de modelos, elija su modelo.

En la página de detalles de su modelo, vaya a la sección Instancias prospectivas para implementar el modelo. En la siguiente captura de pantalla se muestra esta sección.

Captura de pantalla de la lista de instancias prospectivas en la página de detalles del modelo.

En esta sección, puede ver las posibles instancias optimizadas en cuanto a coste, rendimiento y latencia para la implementación del modelo, junto con información adicional para cada tipo de instancia, como el tamaño de la memoria, el número de CPU y GPU y el coste por hora.

Si decide comparar una carga útil de muestra y ejecutar un trabajo de recomendación de inferencia completo para su modelo, puede iniciar un trabajo de recomendación de inferencia predeterminado desde esta página. Para iniciar un trabajo predeterminado a través de la consola, haga lo siguiente:

En la página de detalles del modelo, en la sección Prospective instances to deploy model (Instancias prospectivas para implementar el modelo), elija Run Inference recommender job (Ejecutar el trabajo de recomendación de inferencias).
En el cuadro de diálogo que aparece, para bucket S3 para la carga útil de evaluación comparativa, introduzca la ubicación de Amazon S3 en la que ha almacenado una carga útil de muestra para su modelo.
Para Payload content type (Tipo de contenido de carga útil), introduzca los tipos MIME de los datos de carga útil.
(Opcional) En la sección Compilación de modelos con SageMaker Neo, para la configuración de entrada de datos, introduzca una forma de datos en formato de diccionario.
Elija Run job (Ejecutar trabajo).

El Recomendador de Inferencias inicia el trabajo y puede ver el trabajo y sus resultados en la página de lista de recomendadores de inferencias de la consola de IA. SageMaker

Si desea ejecutar un trabajo avanzado y realizar pruebas de carga personalizadas, o si desea configurar ajustes y parámetros adicionales para su trabajo, consulte Ejecutar una prueba de carga personalizada.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Trabajos de recomendación

Recomendaciones de inferencia