Configure las reglas de creación de perfiles integradas administradas por Amazon Debugger SageMaker - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configure las reglas de creación de perfiles integradas administradas por Amazon Debugger SageMaker

Las reglas del generador de perfiles integrado de Amazon SageMaker Debugger analizan las métricas del sistema y las operaciones del marco recopiladas durante el entrenamiento de un modelo. El depurador ofrece la operación de la API ProfilerRule que ayuda a configurar las reglas para monitorizar las operaciones y los recursos informáticos de entrenamiento y detectar anomalías. Por ejemplo, las reglas de creación de perfiles pueden ayudarle a detectar si hay problemas computacionales, como cuellos de botella en la CPU, un tiempo de espera de E/S excesivo, una carga de trabajo desequilibrada entre los trabajadores de la GPU o la infrautilización de los recursos informáticos. Para ver una lista completa de las reglas integradas de creación de perfiles disponibles, consulte Lista de reglas integradas del generador de perfiles del depurador.

nota

Las reglas integradas se proporcionan a través de los contenedores SageMaker de procesamiento de Amazon y SageMaker Debugger las gestiona completamente sin coste adicional. Para obtener más información sobre la facturación, consulta la página de SageMaker precios de Amazon.

En los siguientes temas, aprenda a utilizar las reglas integradas del depurador.

Utilice las reglas del generador de perfiles integrado en SageMaker Debugger con sus ajustes de parámetros predeterminados

Para añadir las reglas integradas del SageMaker Debugger a su estimador, debe configurar un objeto de lista. rules El siguiente código de ejemplo muestra la estructura básica de la lista de las reglas integradas del SageMaker Debugger.

from sagemaker.debugger import Rule, ProfilerRule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_1()), ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_2()), ... ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_n()), ... # You can also append more debugging rules in the Rule.sagemaker(rule_configs.*()) format. ] estimator=Estimator( ... rules=rules )

Para obtener una lista completa de las reglas integradas disponibles, consulte Lista de reglas integradas del generador de perfiles del depurador.

Para usar las reglas de creación de perfiles e inspeccionar el rendimiento computacional y el progreso de su trabajo de entrenamiento, añada la ProfilerReportregla Debugger. SageMaker Esta regla activa todas las reglas integradas en la familia ProfilerRuleProfilerRuleDebugger. Además, esta regla genera un informe de creación de perfiles agregado. Para obtener más información, consulte Informe de creación de perfiles generado mediante SageMaker el depurador. Puede utilizar el siguiente código para añadir la regla del informe de creación de perfiles a su estimador de entrenamiento.

from sagemaker.debugger import Rule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.ProfilerReport()) ]

Al iniciar el trabajo de entrenamiento con la regla ProfilerReport, el depurador recopila los datos de utilización de los recursos cada 500 milisegundos. El depurador analiza la utilización de los recursos para identificar si su modelo tiene problemas de cuellos de botella. Si las reglas detectan anomalías en el entrenamiento, el estado de evaluación de la regla cambia a IssueFound. Puede configurar acciones automatizadas, como notificar problemas de formación y detener los trabajos de formación mediante Amazon CloudWatch Events y AWS Lambda. Para obtener más información, consulte Action on Amazon SageMaker Debugger Rules.

Utilizar las reglas integradas del creador de perfiles del depurador con valores de parámetros personalizados

Si desea ajustar los valores de los parámetros de las reglas integradas y personalizar la expresión regular de la colección de tensores, configure los parámetros base_config y rule_parameters para los métodos de las clases ProfilerRule.sagemaker y Rule.sagemaker. En el caso de los métodos de la clase Rule.sagemaker, también puede personalizar las colecciones de tensores mediante el parámetro collections_to_save. Para obtener instrucciones sobre cómo usar la clase CollectionConfig, consulte Configurar las colecciones de tensores mediante la API CollectionConfig.

Utilice la siguiente plantilla de configuración para que las reglas integradas personalicen los valores de los parámetros. Al cambiar los parámetros de la regla como desee, puede ajustar la sensibilidad de las reglas que vayan a iniciarse.

Para obtener más información sobre la clase de reglas, los métodos y los parámetros del depurador, consulte la clase de reglas del SageMaker depurador en el SDK de Amazon SageMaker Python.

from sagemaker.debugger import Rule, ProfilerRule, rule_configs, CollectionConfig rules=[ ProfilerRule.sagemaker( base_config=rule_configs.BuiltInProfilerRuleName(), rule_parameters={ "key": "value" } ) ]

Las descripciones de los parámetros y los ejemplos de personalización de valores vienen proporcionados para cada regla en Lista de reglas integradas del generador de perfiles del depurador.

Para obtener una configuración JSON de bajo nivel de las reglas integradas del depurador mediante la API CreateTrainingJob, consulte Configurar el depurador mediante la API de Amazon SageMaker .