

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# SageMaker Depurador Amazon
<a name="train-debugger"></a>

Depure os tensores de saída do modelo de trabalhos de treinamento de aprendizado de máquina em tempo real e detecte problemas não convergentes usando o Amazon Debugger. SageMaker 

## Recursos do Amazon SageMaker Debugger
<a name="debugger-features"></a>

Um trabalho de treinamento de machine learning (ML) pode ter problemas como sobreajuste, funções de ativação com saturação e gradientes que se diminuem, o que pode comprometer o desempenho do modelo.

SageMaker O Debugger fornece ferramentas para depurar trabalhos de treinamento e resolver esses problemas para melhorar o desempenho do seu modelo. O Depurador também oferece ferramentas para enviar alertas quando anomalias de treinamento são encontradas, executar ações contra os problemas e identificar a causa raiz deles por meio da visualização ao coletar métricas e tensores.

SageMaker O Debugger é compatível com as estruturas Apache MXNet,, PyTorch, e. TensorFlow XGBoost Para obter mais informações sobre estruturas e versões disponíveis suportadas pelo SageMaker Debugger, consulte. [Algoritmos e frameworks compatíveis](debugger-supported-frameworks.md)

![\[Visão geral de como o Amazon SageMaker Debugger funciona.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/debugger/debugger-main.png)


O fluxo de trabalho de alto nível do Depurador é o seguinte:

1. Modifique seu script de treinamento com o SDK Python `sagemaker-debugger`, se necessário.

1. Configure um trabalho SageMaker de treinamento com o SageMaker Debugger.
   + Configure usando a API SageMaker AI Estimator (para Python SDK).
   + Configure usando a [`CreateTrainingJob`solicitação de SageMaker IA (para Boto3 ou CLI](https://docs.aws.amazon.com/sagemaker/latest/dg/debugger-createtrainingjob-api.html)).
   + Configure [contêineres de treinamento personalizados](debugger-bring-your-own-container.md) com o SageMaker Debugger.

1. Inicie um trabalho de treinamento e monitore os problemas de treinamento em tempo real.
   + [Lista de regras integradas do Depurador](debugger-built-in-rules.md).

1. Seja alertado e tome medidas imediatas contra os problemas de treinamento.
   + Receba mensagens de texto e e-mails e interrompa os trabalhos de treinamento quando forem encontrados problemas de treinamento no uso de [Usar ações integradas das regras do Depurador](debugger-built-in-actions.md).
   + Configure suas próprias ações usando [Amazon CloudWatch Events AWS Lambda e.](debugger-cloudwatch-lambda.md)

1. Explore uma análise profunda dos problemas de treinamento.
   + Para a depuração de tensores de saída do modelo, consulte [Visualize os tensores de saída do depurador em TensorBoard](debugger-enable-tensorboard-summaries.md).

1. Corrija os problemas, considere as sugestões fornecidas pelo Depurador e repita as etapas de 1 a 5 até otimizar seu modelo e atingir a precisão desejada.

O guia do desenvolvedor do SageMaker Debugger explica os tópicos a seguir.

**Topics**
+ [Recursos do Amazon SageMaker Debugger](#debugger-features)
+ [Algoritmos e frameworks compatíveis](debugger-supported-frameworks.md)
+ [SageMaker Arquitetura do Amazon Debugger](debugger-how-it-works.md)
+ [Tutoriais do Depurador](debugger-tutorial.md)
+ [Depuração de trabalhos de treinamento usando o Amazon Debugger SageMaker](debugger-debug-training-jobs.md)
+ [Lista de regras integradas do Depurador](debugger-built-in-rules.md)
+ [Criação de regras personalizadas usando a biblioteca de cliente do Depurador](debugger-custom-rules.md)
+ [Use o Depurador com contêineres de treinamento personalizados](debugger-bring-your-own-container.md)
+ [Configurar o Debugger usando a API SageMaker](debugger-createtrainingjob-api.md)
+ [Referências do Amazon SageMaker Debugger](debugger-reference.md)