Antes de empezar Pasos para la implementación de modelos

Comprenda las opciones para implementar modelos y obtener inferencias en Amazon SageMaker

Para ayudarle a empezar con la SageMaker inferencia, consulte las siguientes secciones, en las que se explican las opciones para implementar el modelo SageMaker y obtener inferencias. La Opciones de inferencia en Amazon SageMaker sección puede ayudarle a determinar qué función se adapta mejor a su caso de uso para la inferencia.

Puede consultar la Recursos sección para obtener más información sobre resolución de problemas e información de referencia, blogs y ejemplos que le ayudarán a empezar, así como información general. FAQs

Temas

Antes de empezar

En estos temas se presupone que ha creado y entrenado modelos de machine learning y que está listo para implementarlos. No es necesario entrenar el modelo para poder implementarlo SageMaker y obtener inferencias. SageMaker Si no tienes tu propio modelo, también puedes usar SageMaker los algoritmos integrados o los modelos previamente entrenados.

Si eres nuevo SageMaker y aún no has elegido un modelo para implementarlo, sigue los pasos del SageMaker tutorial Comenzar con Amazon. Utilice el tutorial para familiarizarse con la forma en que SageMaker gestiona el proceso de ciencia de datos y cómo gestiona la implementación del modelo. Para obtener más información acerca de entrenamiento de modelos, consulte Entrenamiento de modelos.

Para obtener más información, referencias y ejemplos, consulte Recursos.

Pasos para la implementación de modelos

Para los punto de conexión de inferencia, el flujo de trabajo general consiste en lo siguiente:

Cree un modelo en SageMaker Inference apuntando a los artefactos del modelo almacenados en Amazon S3 y a una imagen de contenedor.
Seleccione una opción de inferencia. Para obtener más información, consulte Opciones de inferencia en Amazon SageMaker.
Cree una configuración de punto final de SageMaker inferencia eligiendo el tipo de instancia y la cantidad de instancias que necesita detrás del punto final. Puede utilizar Amazon SageMaker Inference Recommender para obtener recomendaciones para los tipos de instancias. Para la inferencia sin servidor, solo necesita proporcionar la configuración de memoria que necesita en función del tamaño del modelo.
Cree un punto final de SageMaker inferencia.
Invoque su punto de conexión para recibir una inferencia como respuesta.

El siguiente diagrama muestra el flujo de trabajo anterior.

El flujo de trabajo descrito en el párrafo anterior muestra cómo obtener inferencias. SageMaker

Puede realizar estas acciones mediante la AWS consola, el AWS SDKsSDK, SageMaker Python AWS CloudFormation o el AWS CLI.

Para realizar inferencias por lotes con transformación por lotes, señale los artefactos del modelo y los datos de entrada y cree un trabajo de inferencia por lotes. En lugar de alojar un punto final para realizar inferencias, SageMaker envía sus inferencias a la ubicación de Amazon S3 que elija.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Implementación de modelos

Opciones de inferencia