Actualizar los modelos en producción - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Actualizar los modelos en producción

Las barandillas de implementación son un conjunto de opciones de implementación de modelos en Amazon SageMaker Inference para actualizar sus modelos de aprendizaje automático en producción. Con las opciones de implementación totalmente gestionadas, puede controlar el cambio del modelo actual en producción a uno nuevo. Los modos de cambio de tráfico en las implementaciones azul/verde, como el valor controlado y el lineal, le permiten controlar de forma pormenorizada el proceso de cambio de tráfico del modelo actual al nuevo durante la actualización. También hay protecciones integradas, como las reversiones automáticas, que le ayudan a detectar los problemas a tiempo y a tomar medidas correctivas automáticamente antes de que afecten significativamente a la producción.

Las barreras de protección de implementación proporcionan las siguientes ventajas:

  • Seguridad de implementación al actualizar los entornos de producción. Una actualización regresiva de un entorno de producción puede provocar tiempos de inactividad no planificados y afectar al negocio, como un aumento de la latencia del modelo y altas tasas de error. Las barreras de protección de implementación ayudan a mitigar esos riesgos al proporcionar las mejores prácticas y barreras de protección operativa integradas.

  • Implementación totalmente gestionada. SageMaker se encarga de configurar y organizar estas implementaciones y las integra con los mecanismos de actualización de los terminales. No es necesario crear ni mantener mecanismos de orquestación, monitorización o reversión. Puede aprovechar SageMaker para configurar y organizar estas implementaciones y centrarse en aprovechar el aprendizaje automático para sus aplicaciones.

  • Visibilidad. Puede realizar un seguimiento del progreso de la implementación a través de la DescribeEndpointAPI o de Amazon CloudWatch Events (para los puntos de enlace compatibles). Para obtener más información sobre los eventos en SageMaker, consulte la sección sobre el cambio de estado de despliegue de Endpoint enAutomatizar Amazon SageMaker con Amazon EventBridge. Tenga en cuenta que si su dispositivo de punto final utiliza alguna de las funciones de la Exclusiones página, no podrá utilizar CloudWatch los eventos.

nota

Las barreras de protección de implementación solo se aplican a los tipos de puntos de conexión Inferencia asíncrona y Inferencia en tiempo real.

Cómo comenzar

Admitimos dos tipos de implementación para actualizar los modelos en producción: las implementaciones azul/verde y las implementaciones continuas.

  • Implementaciones azul/verde: puede cambiar el tráfico de su flota anterior (flota azul) a una flota nueva (flota verde) con las actualizaciones. Las implementaciones azul/verde ofrecen múltiples modos de cambio de tráfico. Un modo de cambio de tráfico es una configuración que especifica cómo SageMaker redirige el tráfico de los puntos finales a una nueva flota que contiene tus actualizaciones. Los siguientes modos de cambio de tráfico le proporcionan diferentes niveles de control sobre el proceso de actualización de los puntos de conexión:

    • Cambio de tráfico todo a la vez pasa todo el tráfico de puntos de conexión de la flota azul a la flota verde. Una vez que el tráfico pasa a la flota ecológica, CloudWatch las alarmas de Amazon preespecificadas comienzan a monitorizar la flota ecológica durante un período de tiempo determinado (el período de cocción). Si no se activa ninguna alarma durante el período de inactividad, se SageMaker cancelará la flota azul.

    • Cambio de tráfico de valor controlado pasa una pequeña parte de su tráfico (un valor controlado) a la flota verde y la monitoriza durante un período de cocción. Si el canario tiene éxito en la flota verde, SageMaker desplaza el resto del tráfico de la flota azul a la verde antes de dar por finalizada la flota azul.

    • Cambio de tráfico lineal ofrece una personalización aún mayor en cuanto al número de pasos de cambio de tráfico y el porcentaje de tráfico que se debe cambiar en cada paso. Si bien el cambio de sentido vertical le permite desplazar el tráfico en dos pasos, el cambio lineal lo amplía a n pasos espaciados linealmente.

  • Implementaciones continuas: Puedes actualizar tu punto de conexión para aprovisionar la capacidad de SageMaker forma incremental y desplazar el tráfico a una nueva flota siguiendo los pasos del tamaño de lote que especifiques. Las instancias de la nueva flota se actualizan con la nueva configuración de despliegue y, si no se CloudWatch activa ninguna alarma durante el período de inactividad, se SageMaker limpian las instancias de la flota anterior. Esta opción le proporciona un control pormenorizado sobre el número de instancias o el porcentaje de capacidad que se modifica en cada paso.

Puede crear y administrar su implementación a través de la CreateEndpoint SageMaker API UpdateEndpointy AWS Command Line Interface los comandos. Consulte las páginas de implementación individuales para obtener más información sobre cómo configurar su implementación. Tenga en cuenta que si su punto de conexión utiliza alguna de las funciones enumeradas en la página Exclusiones, no podrá utilizar las barreras de protección de implementación.

Para seguir los ejemplos guiados que muestran cómo utilizar las barreras de protección de implementación, consulte nuestros ejemplos de cuadernos de Jupyter para los modos de cambio de tráfico valor controlado y lineal.