Configura le regole di profilazione integrate gestite da Amazon SageMaker Debugger - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configura le regole di profilazione integrate gestite da Amazon SageMaker Debugger

Le regole di profilazione integrate di Amazon SageMaker Debugger analizzano le metriche di sistema e le operazioni del framework raccolte durante l'addestramento di un modello. Debugger offre il l’operazione API ProfilerRule che aiuta a configurare le regole per monitorare l’addestramento, le risorse e le operazioni di calcolo e rilevare anomalie. Ad esempio, le regole di profilazione possono aiutarti a rilevare eventuali problemi computazionali quali colli di bottiglia della CPU, tempi di attesa I/O eccessivi, carico di lavoro squilibrato tra gli addetti alla GPU e sottoutilizzo delle risorse di calcolo. Per visualizzare l'elenco completo delle regole di profilazione integrate disponibili, consulta Elenco delle regole del profiler integrate di Debugger.

Nota

Le regole integrate vengono fornite tramite contenitori di SageMaker elaborazione Amazon e gestite completamente da SageMaker Debugger senza costi aggiuntivi. Per ulteriori informazioni sulla fatturazione, consulta la pagina SageMaker dei prezzi di Amazon.

Nei seguenti argomenti, imparerai come utilizzare le regole integrate di Debugger.

Utilizza le regole di profilazione integrate di SageMaker Debugger con le relative impostazioni dei parametri predefinite

Per aggiungere le regole integrate del SageMaker Debugger nel tuo estimatore, devi configurare un oggetto elenco. rules Il codice di esempio seguente mostra la struttura di base dell'elenco delle regole integrate del Debugger. SageMaker

from sagemaker.debugger import Rule, ProfilerRule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_1()), ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_2()), ... ProfilerRule.sagemaker(rule_configs.BuiltInProfilerRuleName_n()), ... # You can also append more debugging rules in the Rule.sagemaker(rule_configs.*()) format. ] estimator=Estimator( ... rules=rules )

Per un elenco completo delle regole integrate, consulta Elenco delle regole del profiler integrate di Debugger.

Per utilizzare le regole di profilazione e controllare le prestazioni computazionali e l'avanzamento del lavoro di formazione, aggiungi la regola di Debugger. ProfilerReport SageMaker Questa regola attiva tutte le regole integrate della famiglia Debugger. ProfilerRule ProfilerRule Inoltre, questa regola genera un report di profilazione aggregato. Per ulteriori informazioni, consulta Report di profilazione generato utilizzando Debugger. SageMaker Puoi utilizzare il codice seguente per aggiungere la regola del report di profilazione allo strumento di valutazione dell’addestramento.

from sagemaker.debugger import Rule, rule_configs rules=[ ProfilerRule.sagemaker(rule_configs.ProfilerReport()) ]

Quando avviii il processo di addestramento con la regola ProfilerReport, Debugger raccoglie i dati sull'utilizzo delle risorse ogni 500 millisecondi. Debugger analizza l'utilizzo delle risorse per identificare se il modello presenta problemi di collo di bottiglia. Se le regole rilevano anomalie di addestramento, lo stato di valutazione della regola cambia in IssueFound. Puoi configurare azioni automatizzate, come la notifica di problemi di formazione e l'interruzione dei lavori di formazione utilizzando Amazon CloudWatch Events e. AWS Lambda Per ulteriori informazioni, consulta Azione sulle regole di Amazon SageMaker Debugger.

Usa le regole integrate di Debugger con valori di parametro personalizzati

Se desideri modificare i valori dei parametri delle regole integrate e personalizzare l'espressione regolare della raccolta di tensori, configura i parametri base_config e rule_parameters per i metodi di classe ProfilerRule.sagemaker e Rule.sagemaker. Nel caso dei metodi di classe Rule.sagemaker, puoi anche personalizzare le raccolte di tensori tramite il parametro. collections_to_save Per istruzioni su come utilizzare la classe CollectionConfig, consulta Configura le raccolte Tensor utilizzando il CollectionConfig API.

Utilizza il seguente modello di configurazione per le regole integrate per personalizzare i valori dei parametri. Modificando i parametri delle regole come si desidera, è possibile regolare la sensibilità delle regole da avviare.

Per ulteriori informazioni sulla classe di regole, i metodi e i parametri Debugger, consulta la classe SageMakerDebugger Rule nell'SDK Amazon Python. SageMaker

from sagemaker.debugger import Rule, ProfilerRule, rule_configs, CollectionConfig rules=[ ProfilerRule.sagemaker( base_config=rule_configs.BuiltInProfilerRuleName(), rule_parameters={ "key": "value" } ) ]

Le descrizioni dei parametri e gli esempi di personalizzazione dei valori sono disponibili per ogni regola in Elenco delle regole del profiler integrate di Debugger.

Per una configurazione JSON di basso livello delle regole integrate di Debugger che utilizzano l'API CreateTrainingJob, consulta Configurazione del debugger utilizzando l'API Amazon SageMaker .