Obtener posibles instancias instantáneas - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Obtener posibles instancias instantáneas

Inference Recommender también puede proporcionarle una lista de posibles instancias, o tipos de instancias que podrían ser adecuados para su modelo, en la página de detalles de su SageMaker modelo. El Recomendador de inferencias realiza automáticamente una evaluación comparativa preliminar con su modelo para proporcionarle las cinco instancias más probables. Como se trata de recomendaciones preliminares, le recomendamos que ejecute más trabajos de recomendación de instancias para obtener resultados más precisos.

Puede ver una lista de posibles instancias para su modelo mediante programación mediante SageMaker Python SDK o la SageMaker consola. DescribeModelAPI

nota

No obtendrá instancias potenciales para los modelos que creó SageMaker antes de que esta función estuviera disponible.

Para ver las posibles instancias del modelo a través de la consola, haga lo siguiente:

  1. Ve a la SageMaker consola en https://console.aws.amazon.com/sagemaker/.

  2. En el panel de navegación, elija Inferencia y a continuación elija Modelos.

  3. En la lista de modelos, elija su modelo.

En la página de detalles de su modelo, vaya a la sección Instancias prospectivas para implementar el modelo. En la siguiente captura de pantalla se muestra esta sección.

Captura de pantalla de la lista de instancias prospectivas en la página de detalles del modelo.

En esta sección, puede ver las posibles instancias optimizadas en cuanto a coste, rendimiento y latencia para la implementación del modelo, junto con información adicional para cada tipo de instancia, como el tamaño y el GPU recuento de la memoria CPU y el coste por hora.

Si decide comparar una carga útil de muestra y ejecutar un trabajo de recomendación de inferencia completo para su modelo, puede iniciar un trabajo de recomendación de inferencia predeterminado desde esta página. Para iniciar un trabajo predeterminado a través de la consola, haga lo siguiente:

  1. En la página de detalles del modelo, en la sección Prospective instances to deploy model (Instancias prospectivas para implementar el modelo), elija Run Inference recommender job (Ejecutar el trabajo de recomendación de inferencias).

  2. En el cuadro de diálogo que aparece, para bucket S3 para la carga útil de evaluación comparativa, introduzca la ubicación de Amazon S3 en la que ha almacenado una carga útil de muestra para su modelo.

  3. En el tipo de contenido de carga útil, introduzca los MIME tipos de los datos de carga útil.

  4. (Opcional) En la sección Compilación de modelos con SageMaker Neo, para la configuración de entrada de datos, introduzca una forma de datos en formato de diccionario.

  5. Elija Run job (Ejecutar trabajo).

El Recomendador de Inferencias inicia el trabajo y puede ver el trabajo y sus resultados en la página de lista de recomendadores de inferencias de la consola. SageMaker

Si desea ejecutar un trabajo avanzado y realizar pruebas de carga personalizadas, o si desea configurar ajustes y parámetros adicionales para su trabajo, consulte Ejecutar una prueba de carga personalizada.