Agregar o eliminar modelos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Agregar o eliminar modelos

Puede implementar modelos adicionales en un punto de conexión multimodelo e invocarlos a través de ese punto de conexión de inmediato. Al agregar un modelo nuevo, no es necesario actualizar o reducir el punto de conexión, por lo que evita el coste de crear y ejecutar un punto de conexión independiente para cada modelo nuevo. El proceso para añadir y eliminar modelos es el mismo para los puntos finales multimodelo CPU y GPU respaldados por ellos.

SageMaker descarga los modelos no utilizados del contenedor cuando la instancia alcanza su capacidad de memoria y es necesario descargar más modelos al contenedor. SageMaker también elimina los artefactos de modelos no utilizados del volumen de almacenamiento de la instancia cuando el volumen alcanza su capacidad máxima y es necesario descargar nuevos modelos. La primera invocación a un modelo recién agregado tarda más tiempo porque el punto de conexión tarda tiempo en descargar el modelo desde S3 a la memoria del contenedor en la instancia que aloja el punto de conexión

Con el punto de conexión ya en ejecución, copie un nuevo conjunto de artefactos de modelo en la ubicación de Amazon S3 en la que almacene los modelos.

# Add an AdditionalModel to the endpoint and exercise it aws s3 cp AdditionalModel.tar.gz s3://my-bucket/path/to/artifacts/
importante

Para actualizar un modelo, proceda como haría al agregar un modelo nuevo. Use un nombre nuevo y único. No sobrescriba artefactos del modelo en Amazon S3 ya que la versión antigua del modelo podría aún cargarse en los contenedores o en el volumen de almacenamiento de las instancias en el punto de conexión. Las invocaciones al nuevo modelo podrían invocar la versión anterior del modelo.

Las aplicaciones cliente pueden solicitar predicciones del modelo de destino adicional en cuanto se almacene en S3.

response = runtime_sagemaker_client.invoke_endpoint( EndpointName='<ENDPOINT_NAME>', ContentType='text/csv', TargetModel='AdditionalModel.tar.gz', Body=body)

Para eliminar un modelo de un punto de conexión multimodelo, deje de invocar el modelo desde los clientes y elimínelo de la ubicación de S3 donde se almacenan los artefactos del modelo.