使用 CollectionConfig API 設定張量集合 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 CollectionConfig API 設定張量集合

使用 CollectionConfig API 作業設定張量集合。如果使用 Debugger 支援的深度學習架構和機器學習演算法,Debugger 提供預先構建的張量集合,涵蓋各種參數的正規表示式 (regex)。如下列範例程式碼所示,新增您要偵錯的內建張量集合。

from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig(name="weights"), CollectionConfig(name="gradients") ]

前面的集合設定了 Debugger 勾點,基於預設的 "save_interval" 值,每 500 個步驟儲存張量。

如需可用 Debugger 內建集合的完整清單,請參閱 Debugger 內建集合

如果您想自訂內建集合,例如變更儲存間隔和張量規則表達式,請使用下列 CollectionConfig 範本調整參數。

from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig( name="tensor_collection", parameters={ "key_1": "value_1", "key_2": "value_2", ... "key_n": "value_n" } ) ]

如需可用參數索引鍵的更多相關資訊,請參閱 Amazon SageMaker Python SDK 中的 CollectionConfig。例如,下列程式碼範例會示範如何在不同訓練階段調整 “遺失” 張量集合的儲存間隔:在訓練階段每 100 個步驟儲存一次遺失,並在驗證階段每 10 個步驟儲存一次驗證遺失。

from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig( name="losses", parameters={ "train.save_interval": "100", "eval.save_interval": "10" } ) ]
提示

此張量集合組態物件可同時用於 DebuggerHookConfigRule API 作業。