Configure regras de criação de perfil integradas gerenciadas pelo Amazon SageMaker Debugger - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configure regras de criação de perfil integradas gerenciadas pelo Amazon SageMaker Debugger

As regras integradas do criador de perfil do Amazon SageMaker Debugger analisam as métricas do sistema e as operações de estrutura coletadas durante o treinamento de um modelo. O Debugger oferece a operação de API ProfilerRule que ajuda a configurar as regras para monitorar os recursos e operações de computação de treinamento e detectar anomalias. Por exemplo, as regras de criação de perfil podem ajudá-lo a detectar se há problemas computacionais, como gargalos na CPU, tempo de espera excessivo de E/S, carga de trabalho desequilibrada entre os funcionários da GPU e subutilização de recursos computacionais. Para obter uma lista completa das regras de criação de perfil disponíveis, consulte Lista de regras integradas do perfilador do Debugger.

nota

As regras integradas são fornecidas por meio de contêineres SageMaker de processamento da Amazon e totalmente gerenciadas pelo SageMaker Debugger sem custo adicional. Para obter mais informações sobre faturamento, consulte a página de SageMaker preços da Amazon.

Nos tópicos a seguir, aprenda a usar as regras integradas do Debugger.

Use as regras de criação de perfil integradas do SageMaker Debugger com suas configurações de parâmetros padrão

Para adicionar regras integradas do SageMaker Debugger em seu estimador, você precisa configurar um objeto de lista. rules O código de exemplo a seguir mostra a estrutura básica da listagem das regras integradas do SageMaker Debugger.

from sagemaker.debugger import Rule, ProfilerRule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_1()), ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_2()), ... ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_n()), ... # You can also append more debugging rules in the Rule.sagemaker(rule_configs.*()) format. ] estimator=Estimator( ... rules=rules )

Para obter uma lista completa das regras integradas, consulte Lista de regras integradas do perfilador do Debugger.

Para usar as regras de criação de perfil e inspecionar o desempenho computacional e o progresso do seu trabalho de treinamento, adicione a ProfilerReportregra do Debugger. SageMaker Essa regra ativa todas as regras integradas da família Debugger ProfilerRuleProfilerRule. Além disso, essa regra gera um relatório agregado de criação de perfil. Para obter mais informações, consulte Relatório de criação de perfil gerado usando o SageMaker Debugger. Você pode usar o código a seguir para adicionar a regra do relatório de criação de perfil ao seu estimador de treinamento.

from sagemaker.debugger import Rule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.ProfilerReport()) ]

Quando você inicia o trabalho de treinamento com a regra ProfilerReport, o Debugger coleta dados de utilização de recursos a cada 500 milissegundos. O Debugger analisa a utilização de recursos para identificar se seu modelo está com problemas de gargalo. Se as regras detectarem anomalias de treinamento, o status de avaliação da regra mudará para IssueFound. Você pode configurar ações automatizadas, como notificar problemas de treinamento e interromper trabalhos de treinamento usando Amazon CloudWatch Events e. AWS Lambda Para ter mais informações, consulte Ação nas regras do Amazon SageMaker Debugger.

Use as regras de criação de perfil integradas do Debugger com valores de parâmetros personalizados

Se você quiser ajustar os valores dos parâmetros da regra integrada e personalizar o regex da coleção de tensores, configure os parâmetros base_config e rule_parameters para os métodos da classe ProfilerRule.sagemaker e Rule.sagemaker. No caso dos métodos de classe Rule.sagemaker, você também pode personalizar coleções de tensores por meio do parâmetro collections_to_save. Para obter instruções sobre como usar a classe CollectionConfig, consulte Configurar coleções de tensores usando a API CollectionConfig.

Use o modelo de configuração a seguir para regras integradas para personalizar os valores dos parâmetros. Ao alterar os parâmetros da regra conforme desejar, você pode ajustar a sensibilidade das regras a serem iniciadas.

Para obter mais informações sobre a classe de regras, os métodos e os parâmetros do Debugger, consulte a classe SageMakerDebugger Rule no SDK do Amazon Python. SageMaker

from sagemaker.debugger import Rule, ProfilerRule, rule_configs, CollectionConfig rules=[ ProfilerRule.sagemaker( base_config=rule_configs.BuiltInProfilerRuleName(), rule_parameters={ "key": "value" } ) ]

As descrições dos parâmetros e os exemplos de personalização de valores são fornecidos para cada regra em Lista de regras integradas do perfilador do Debugger.

Para uma configuração JSON de baixo nível das regras integradas do Debugger usando a API CreateTrainingJob, consulte Configurar o depurador usando a API da Amazon SageMaker .