Integrierte Profiler-Regeln konfigurieren, die von Amazon SageMaker Debugger verwaltet werden - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Integrierte Profiler-Regeln konfigurieren, die von Amazon SageMaker Debugger verwaltet werden

Die in Amazon SageMaker Debugger integrierten Profiler-Regeln analysieren Systemmetriken und Framework-Operationen, die während des Trainings eines Modells erfasst wurden. Debugger bietet eine ProfilerRule API-Operation, mit deren Hilfe die Regeln konfiguriert werden können, um Trainingsressourcen und Rechenoperationen zu überwachen und Anomalien zu erkennen. Mithilfe der Profilerstellungsregeln können Sie beispielsweise erkennen, ob Rechenprobleme wie CPU-Engpässe, übermäßige I/O-Wartezeiten, ungleichmäßige Arbeitslast zwischen GPU-Workern und unzureichende Auslastung der Rechenressourcen vorliegen. Eine vollständige Liste der verfügbaren integrierten Profilerstellungsregeln finden Sie unter Liste der im Debugger integrierten Profiler-Regeln.

Anmerkung

Die integrierten Regeln werden über SageMaker Amazon-Verarbeitungscontainer bereitgestellt und vollständig von SageMaker Debugger ohne zusätzliche Kosten verwaltet. Weitere Informationen zur Abrechnung finden Sie auf der Seite mit den SageMaker Amazon-Preisen.

In den folgenden Themen erfahren Sie, wie Sie die integrierten Debuger-Regeln verwenden.

Verwenden Sie die in SageMaker Debugger integrierten Profiler-Regeln mit ihren Standardparametereinstellungen

Um Ihrem Estimator integrierte SageMaker Debugger-Regeln hinzuzufügen, müssen Sie ein Listenobjekt konfigurieren. rules Der folgende Beispielcode zeigt die grundlegende Struktur der Auflistung der integrierten SageMaker Debugger-Regeln.

from sagemaker.debugger import Rule, ProfilerRule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_1()), ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_2()), ... ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_n()), ... # You can also append more debugging rules in the Rule.sagemaker(rule_configs.*()) format. ] estimator=Estimator( ... rules=rules )

Eine vollständige Liste der verfügbaren integrierten Regeln finden Sie unter Liste der im Debugger integrierten Profiler-Regeln.

Um die Profilerstellungsregeln zu verwenden und die Rechenleistung und den Fortschritt Ihrer Trainingsaufgabe zu überprüfen, fügen Sie die ProfilerReportRegel Debugger hinzu. SageMaker Diese Regel aktiviert alle integrierten Regeln der Debugger-Familie. ProfilerRule ProfilerRule Darüber hinaus generiert diese Regel einen aggregierten Profilerstellungsbericht. Weitere Informationen finden Sie unter Mit SageMaker dem Debugger generierter Profilerstellungsbericht. Sie können den folgenden Code verwenden, um die Regel für den Profilerstellungsbericht zu Ihrem Trainingsschätzer hinzuzufügen.

from sagemaker.debugger import Rule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.ProfilerReport()) ]

Wenn Sie den Trainingsauftrag mit der ProfilerReport Regel starten, erfasst der Debugger alle 500 Millisekunden Daten zur Ressourcennutzung. Der Debugger analysiert die Ressourcennutzung, um festzustellen, ob Ihr Modell Engpassprobleme aufweist. Wenn die Regeln Trainingsanomalien erkennen, ändert sich der Status der Regelauswertung in IssueFound. Mit Amazon CloudWatch Events und können Sie automatisierte Aktionen einrichten, z. B. das Melden von Schulungsproblemen und das Beenden von Schulungsaufträgen. AWS Lambda Weitere Informationen finden Sie unter Aktion auf Amazon SageMaker Debugger-Regeln.

Verwenden Sie die in Debugger integrierten Profiler-Regeln mit benutzerdefinierten Parameterwerten

Wenn Sie die Werte der integrierten Regelparameter anpassen und die Regex für die Tensorsammlung anpassen möchten, konfigurieren Sie die base_config und rule_parameters Parameter für die ProfilerRule.sagemaker und Rule.sagemaker Klassenmethoden. Bei den Rule.sagemaker Klassenmethoden können Sie die Tensorsammlungen auch über den collections_to_save Parameter anpassen. Anweisungen zur Verwendung der CollectionConfig Klasse, finden Sie unter Konfigurieren Sie Tensor-Sammlungen mithilfe der CollectionConfig API.

Verwenden Sie die folgende Konfigurationsvorlage für integrierte Regeln, um Parameterwerte anzupassen. Indem Sie die Regelparameter nach Ihren Wünschen ändern, können Sie die Sensitivität der Regeln, die initiiert werden sollen, anpassen.

  • Das base_config-Argument ist der Ort, an dem Sie die integrierten Regelmethoden aufrufen.

  • Das rule_parameters-Argument besteht darin, die Standardschlüsselwerte der unter Liste der im Debugger integrierten Profiler-Regeln aufgeführten integrierten Regeln anzupassen.

Weitere Informationen über die Debugger-Regelklasse, Methoden und Parameter finden Sie unter SageMakerDebugger-Regelklasse im Amazon SageMaker Python SDK.

from sagemaker.debugger import Rule, ProfilerRule, rule_configs, CollectionConfig rules=[ ProfilerRule.sagemaker( base_config=rule_configs.BuiltInProfilerRuleName(), rule_parameters={ "key": "value" } ) ]

Die Parameterbeschreibungen und Beispiele für die Anpassung von Werten finden Sie für jede Regel unter Liste der im Debugger integrierten Profiler-Regeln.

Eine einfache JSON-Konfiguration der integrierten Debuger-Regeln mithilfe der CreateTrainingJob API finden Sie unter Konfigurieren des Debuggers mithilfe der Amazon SageMaker -API.