使用 CollectionConfig
API 配置张量集合
使用 CollectionConfig
API 操作配置张量集合。在使用 Debugger 支持的深度学习框架和机器学习算法时,Debugger 提供预构建的张量集合,涵盖了参数的各种正则表达式 (regex)。如以下示例代码所示,添加要调试的内置张量集合。
from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig(name="weights"), CollectionConfig(name="gradients") ]
前面的集合设置 Debugger 钩子基于默认 "save_interval"
值,每 500 个步骤保存一次张量值。
有关可用的 Debugger 内置集合的完整列表,请参阅 Debugger 内置集合
如果您希望自定义内置集合,例如更改保存时间间隔和张量正则表达式,请使用以下 CollectionConfig
模板来调整参数。
from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig( name="
tensor_collection
", parameters={ "key_1
": "value_1
", "key_2
": "value_2
", ... "key_n
": "value_n
" } ) ]
有关可用参数键的详细信息,请参阅 Amazon SageMaker Python SDK
from sagemaker.debugger import CollectionConfig collection_configs=[ CollectionConfig( name="
losses
", parameters={ "train.save_interval
": "100
", "eval.save_interval
": "10
" } ) ]
提示
此张量集合配置对象可以用于 DebuggerHookConfig 和 Rule API 操作。