使用 設定張量集合 CollectionConfig API - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 設定張量集合 CollectionConfig API

使用 CollectionConfigAPI操作來設定張量集合。如果使用 Debugger 支援的深度學習架構和機器學習演算法,Debugger 提供預先構建的張量集合,涵蓋各種參數的正規表示式 (regex)。如下列範例程式碼所示,新增您要偵錯的內建張量集合。

from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig(name="weights"), CollectionConfig(name="gradients") ]

前面的集合設定了 Debugger 勾點,基於預設的 "save_interval" 值,每 500 個步驟儲存張量。

如需可用 Debugger 內建集合的完整清單,請參閱 Debugger 內建集合

如果您想自訂內建集合,例如變更儲存間隔和張量規則表達式,請使用下列 CollectionConfig 範本調整參數。

from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig( name="tensor_collection", parameters={ "key_1": "value_1", "key_2": "value_2", ... "key_n": "value_n" } ) ]

如需可用參數金鑰的詳細資訊,請參閱 Amazon Python CollectionConfig中的 。 SageMaker SDK例如,下列程式碼範例會示範如何在不同訓練階段調整 “遺失” 張量集合的儲存間隔:在訓練階段每 100 個步驟儲存一次遺失,並在驗證階段每 10 個步驟儲存一次驗證遺失。

from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig( name="losses", parameters={ "train.save_interval": "100", "eval.save_interval": "10" } ) ]
提示

此張量收集組態物件可用於 DebuggerHookConfig規則API操作。