Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Supervise el uso de los recursos AWS informáticos en Amazon SageMaker Studio Classic
Para realizar un seguimiento del uso de los recursos informáticos de su trabajo de formación, utilice las herramientas de supervisión que ofrece Amazon SageMaker Debugger.
Para cualquier trabajo de entrenamiento que ejecute SageMaker con el SDK de SageMaker Python, Debugger recopila métricas básicas de uso de recursos, como el uso de la CPU, el uso de la GPU, el uso de la memoria de la GPU, la red y el tiempo de espera de E/S cada 500 milisegundos. Para ver el panel de control con las métricas de uso de recursos de tu trabajo de formación, simplemente usa la interfaz de usuario del SageMaker Debugger en Studio Experiments. SageMaker
Las operaciones y los pasos del aprendizaje profundo pueden funcionar en intervalos de milisegundos. En comparación con CloudWatch las métricas de Amazon, que recopilan las métricas a intervalos de 1 segundo, Debugger proporciona una granularidad más precisa de las métricas de utilización de los recursos en intervalos de 100 milisegundos (0,1 segundos) para que puedas profundizar en las métricas a nivel de una operación o un paso.
Si desea cambiar el intervalo de tiempo de recopilación de métricas, puede añadir un parámetro para la configuración de la creación de perfiles a su lanzador de trabajos de entrenamiento. Por ejemplo, si utilizas el SDK de SageMaker Python, debes pasar el profiler_config
parámetro al crear un objeto estimador. Para obtener información sobre cómo ajustar el intervalo de recopilación de métricas de utilización de los recursos, consulte Plantilla de código para configurar un objeto SageMaker estimador con los módulos Python SageMaker Debugger en Python SageMaker SDK y, a continuación, Configurar los ajustes para la creación de perfiles básicos de la utilización de los recursos del sistema.
Además, puede añadir herramientas de detección de problemas denominadas reglas de creación de perfiles integradas que proporciona Debugger. SageMaker Las reglas de creación de perfiles integradas analizan las métricas de utilización de los recursos y detectan problemas de rendimiento computacional. Para obtener más información, consulte Utilice reglas de creación de perfiles integradas administradas por Amazon Debugger SageMaker . Puede recibir los resultados del análisis de reglas a través de la interfaz de usuario del SageMaker depurador de SageMaker Studio Experiments o del informe de creación de perfiles del SageMaker depurador
Para obtener más información sobre las funcionalidades de supervisión que ofrece SageMaker Debugger, consulte los siguientes temas.
Temas
- Configuración del estimador con parámetros para la creación de perfiles básicos mediante los módulos Python de Amazon Debugger SageMaker
- Utilice reglas de creación de perfiles integradas administradas por Amazon Debugger SageMaker
- Lista de reglas integradas del generador de perfiles del depurador
- Interfaz de usuario de Amazon SageMaker Debugger en Amazon SageMaker Studio Classic Experiments
- SageMaker Informe interactivo sobre el depurador
- Análisis de datos mediante la biblioteca cliente de Python del depurador