Architecture d'Amazon SageMaker Debugger - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Architecture d'Amazon SageMaker Debugger

Cette rubrique présente une présentation détaillée du flux de travail Amazon SageMaker Debugger.

Debugger prend en charge la fonctionnalité de profilage pour optimiser les performances afin d'identifier les problèmes de calcul, tels que les goulets d'étranglement et la sous-utilisation du système, et pour aider à optimiser l'utilisation des ressources matérielles à grande échelle.

La fonctionnalité de débogage de Debugger, qui vise à optimiser les modèles, consiste à analyser les problèmes d'entraînement non convergents pouvant survenir, tout en minimisant les fonctions de perte à l'aide d'algorithmes d'optimisation, tels que la descente de gradient et ses variations.

Le schéma suivant montre l'architecture de SageMaker Debugger. Les encadrements avec des lignes en gras illustrent ce que fait Debugger pour analyser votre tâche d'entraînement.

Présentation du fonctionnement d'Amazon SageMaker Debugger.

Debugger stocke les données suivantes de vos tâches d'entraînement dans votre compartiment Amazon S3 sécurisé :

  • Output tensors (Tenseurs de sortie) – Ensembles de paramètres scalaires et de modèle qui sont constamment mis à jour pendant les passes en avant et en arrière lors de l'entraînement des modèles de ML. Les tenseurs de sortie comprennent des valeurs scalaires (précision et perte) et des matrices (pondérations, gradients, couches en entrée et couches en sortie).

    Note

    Par défaut, Debugger surveille et débogue les tâches d' SageMaker entraînement sans qu'aucun paramètre spécifique au Debugger ne soit configuré dans les estimateurs. SageMaker Debugger collecte des métriques système toutes les 500 millisecondes et des tenseurs de sortie de base (sorties scalaires telles que la perte et la précision) toutes les 500 étapes. Il exécute également la règle ProfilerReport pour analyser les métriques système et agréger le tableau de bord Studio Debugger Insights ainsi qu'un rapport de profilage. Debugger enregistre les données de sortie dans votre compartiment Amazon S3 sécurisé.

Les règles intégrées de Debugger s'exécutent sur les conteneurs de traitement, qui sont conçus pour évaluer les modèles de machine learning en traitant les données d'entraînement collectées dans votre compartiment S3 (voir Traitement des données et évaluation des modèles). Les règles intégrées sont entièrement gérées par Debugger. Vous pouvez également créer vos propres règles personnalisées pour votre modèle afin de contrôler les problèmes que vous souhaitez contrôler.