选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

Amazon SageMaker 调试器

聚焦模式
Amazon SageMaker 调试器 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon Debugger 实时调试机器学习训练作业中的模型输出张量,并检测非融合问题。 SageMaker

Amazon SageMaker Debugger 功能

机器学习 (ML) 训练作业可能存在系统瓶颈、过度拟合、饱和激活函数和梯度消失等问题,这些问题会影响模型性能。

SageMaker Debugger 提供了用于调试训练作业和解决此类问题的工具,从而提高模型的性能。Debugger 也提供了一些工具,用于在发现训练异常情况时发送警报,针对问题采取措施,并通过将收集的指标和张量可视化来确定造成问题的根本原因。

SageMaker 调试器支持 Apache MXNet、 PyTorch TensorFlow、和框架。 XGBoost 有关 D SageMaker ebugger 支持的可用框架和版本的更多信息,请参阅支持的框架和算法

Amazon SageMaker 调试器的工作原理概述。

Debugger 工作流概述如下:

  1. 如果需要,可以使用 sagemaker-debugger Python SDK 修改您的训练脚本。

  2. 使用 SageMaker 调试器配置 SageMaker 训练作业。

  3. 启动训练作业并实时监控训练问题。

  4. 获取警报并针对训练问题迅速采取措施。

  5. 探索对训练问题的深入分析。

  6. 修复问题,考虑 Debugger 提供的建议,然后重复步骤 1-5,直到模型得到优化并达到目标准确性。

《 SageMaker 调试器开发者指南》将引导您完成以下主题。

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。