As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Etapa 2: Iniciar e depurar trabalhos de treinamento usando Python SageMaker SDK
Para configurar um SageMaker estimador com o SageMaker Debugger, use o Amazon SageMaker Python SDKdebugger_hook_config
, tensorboard_output_config
e rules
.
Importante
Antes de criar e executar o método de ajuste do estimador para iniciar um trabalho de treinamento, certifique-se de adaptar seu script de treinamento seguindo as instruções em Etapa 1: Adapte seu script de treinamento para registrar um hook.
Construa um SageMaker estimador com parâmetros específicos do Debugger
Os exemplos de código nesta seção mostram como construir um SageMaker estimador com os parâmetros específicos do Debugger.
nota
Os exemplos de código a seguir são modelos para construir os estimadores da SageMaker estrutura e não são diretamente executáveis. Você precisa prosseguir para as próximas seções e configurar os parâmetros específicos do Debugger.
Configure os seguintes parâmetros para ativar o SageMaker Debugger:
-
debugger_hook_config
(um objeto deDebuggerHookConfig
) — Necessário para ativar o gancho no script de treinamento adaptado duranteEtapa 1: Adapte seu script de treinamento para registrar um hook, configurar o iniciador de SageMaker treinamento (estimador) para coletar tensores de saída de seu trabalho de treinamento e salvar os tensores em seu bucket S3 protegido ou em sua máquina local. Para aprender a configurar o parâmetro debugger_hook_config
, consulte Configurar o SageMaker depurador para salvar tensores. -
rules
(uma lista deRule
objetos) — Configure esse parâmetro para ativar as regras internas do SageMaker Debugger que você deseja executar em tempo real. As regras integradas são lógicas que depuram automaticamente o progresso do treinamento do seu modelo e encontram problemas de treinamento analisando os tensores de saída salvos em seu bucket seguro do S3. Para aprender a configurar o parâmetro rules
, consulte Configurar regras integradas do Depurador. Para encontrar uma lista completa de regras integradas para depuração de tensores de saída, consulte Regra do Debugger. Se você quiser criar sua própria lógica para detectar problemas de treinamento, consulte Crie regras personalizadas do Debugger para Análise de trabalho de treinamento.nota
As regras integradas estão disponíveis somente por meio de instâncias SageMaker de treinamento. Você não pode usá-los no modo local.
-
tensorboard_output_config
(um objeto deTensorBoardOutputConfig
) — Configure o SageMaker Debugger para coletar tensores de saída no formato TensorBoard compatível e salvar no caminho de saída do S3 especificado no objeto. TensorBoardOutputConfig
Para saber mais, consulte Visualize os tensores de saída do Amazon SageMaker Debugger em TensorBoard.nota
O
tensorboard_output_config
deve ser configurado com odebugger_hook_config
parâmetro, o que também exige que você adapte seu script de treinamento adicionando o hooksagemaker-debugger
.
nota
SageMaker O depurador salva com segurança os tensores de saída em subpastas do seu bucket do S3. Por exemplo, o formato do bucket padrão do S3 URI em sua conta és3://sagemaker-<region>-<12digit_account_id>/<base-job-name>/<debugger-subfolders>/
. Há duas subpastas criadas pelo SageMaker Debugger: e. debug-output
rule-output
Se você adicionar o tensorboard_output_config
parâmetro, também encontrará a pasta tensorboard-output
.
Consulte os tópicos a seguir para encontrar mais exemplos de como configurar os parâmetros específicos do Debugger em detalhes.