Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Formación puntual gestionada en Amazon SageMaker AI
Amazon SageMaker AI facilita el entrenamiento de modelos de aprendizaje automático mediante instancias gestionadas de Amazon EC2 Spot. El entrenamiento de spot administrado puede optimizar el coste de los modelos de entrenamiento hasta un 90 % con respecto a instancias bajo demanda. SageMaker La IA gestiona las interrupciones de Spot en tu nombre.
Managed Spot Training utiliza la instancia de Amazon EC2 Spot para ejecutar trabajos de formación en lugar de instancias bajo demanda. Puedes especificar qué trabajos de formación utilizan instancias puntuales y una condición de parada que especifique cuánto tiempo espera la SageMaker IA a que se ejecute un trabajo con instancias EC2 puntuales de Amazon. Las métricas y los registros generados durante las sesiones de entrenamiento están disponibles en CloudWatch.
El ajuste automático de modelos de Amazon SageMaker AI, también conocido como ajuste de hiperparámetros, puede utilizar un entrenamiento puntual gestionado. Para obtener más información, consulte Ajuste automático de modelos con IA SageMaker .
Las instancias de Spot se pueden interrumpir, lo que hace que los trabajos tarden más en iniciarse o finalizar. Puede configurar su trabajo de entrenamiento puntual gestionado para utilizar puntos de control. SageMaker La IA copia los datos de los puntos de control de una ruta local a Amazon S3. Cuando se reinicia el trabajo, la SageMaker IA copia los datos de Amazon S3 de nuevo en la ruta local. A continuación, el entrenamiento puede reanudarse desde el último punto de control en lugar de reiniciarse. Para obtener más información sobre los puntos de control, consulte Puntos de control en Amazon AI SageMaker .
nota
A menos que su trabajo de formación se complete rápidamente, le recomendamos que utilice los puntos de control con una formación puntual gestionada. SageMaker Los algoritmos integrados en la IA y los algoritmos de mercado que no utilizan puntos MaxWaitTimeInSeconds
de control están limitados actualmente a 3600 segundos (60 minutos).
Para utilizar el entrenamiento de spot administrado, cree un trabajo de entrenamiento. Establezca EnableManagedSpotTraining
en True
y especifique el MaxWaitTimeInSeconds
. MaxWaitTimeInSeconds
debe ser mayor que MaxRuntimeInSeconds
. Para obtener información sobre la creación de un trabajo de capacitación, consulte DescribeTrainingJob.
Puede calcular los ahorros derivados del uso del entrenamiento de spot administrado mediante la fórmula (1 -
(BillableTimeInSeconds / TrainingTimeInSeconds)) * 100
. Por ejemplo, si BillableTimeInSeconds
es 100 y TrainingTimeInSeconds
500, significa que su trabajo de entrenamiento duró 500 segundos, pero se le facturó solo 100 segundos. Sus ahorros son de (1 - (100/500)) * 100 = 80%.
Para saber cómo ejecutar trabajos de formación en instancias puntuales de Amazon SageMaker AI y cómo funciona la formación puntual gestionada y reduce el tiempo facturable, consulta los siguientes cuadernos de ejemplo: