Depuración y mejora del rendimiento del modelo

La esencia del entrenamiento de modelos de machine learning, redes neuronales de aprendizaje profundo y modelos de transformadores consiste en lograr una convergencia de modelos estable y, por lo tanto, los modelos más avanzados tienen millones, miles de millones o billones de parámetros de modelo. La cantidad de operaciones para actualizar la enorme cantidad de parámetros del modelo durante cada iteración puede convertirse fácilmente en astronómica. Para identificar los problemas de convergencia del modelo, es importante poder acceder a los parámetros, activaciones y gradientes del modelo calculados durante los procesos de optimización.

Amazon SageMaker AI proporciona dos herramientas de depuración para ayudar a identificar estos problemas de convergencia y obtener visibilidad de sus modelos.

Amazon SageMaker AI con TensorBoard

Para ofrecer una mayor compatibilidad con las herramientas comunitarias de código abierto de la plataforma de formación de SageMaker IA, la SageMaker IA se aloja TensorBoard como una aplicación en el dominio de la SageMaker IA. Puedes trasladar tus tareas de entrenamiento a la SageMaker IA y seguir utilizando el redactor de TensorBoard resúmenes para recopilar los tensores de salida del modelo. Al TensorBoard estar implementado en el dominio de la SageMaker IA, también te ofrece más opciones para gestionar los perfiles de usuario del dominio de SageMaker IA de tu AWS cuenta y proporciona un control preciso de los perfiles de usuario al permitir el acceso a acciones y recursos específicos. Para obtener más información, consulte TensorBoard en Amazon SageMaker AI.

Amazon SageMaker Debugger

Amazon SageMaker Debugger es una función de SageMaker IA que proporciona herramientas para registrar enlaces y retrollamadas con el fin de extraer los tensores de salida del modelo y guardarlos en Amazon Simple Storage Service. Incluye reglas integradas para detectar problemas de convergencia de modelos, como el sobreajuste, la saturación de las funciones de activación, la desaparición de los gradientes, etc. También puede configurar las reglas integradas con Amazon CloudWatch Events y AWS Lambda para tomar medidas automatizadas contra los problemas detectados, y configurar Amazon Simple Notification Service para recibir notificaciones por correo electrónico o texto. Para obtener más información, consulte Amazon SageMaker Debugger.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Notas de la versión

TensorBoard en SageMaker IA