Amazon SageMaker 机器学习世系跟踪 - Amazon SageMaker

Amazon SageMaker 机器学习世系跟踪

重要

自 2023 年 11 月 30 日起,以前的 Amazon SageMaker Studio 体验现在被命名为 Amazon SageMaker Studio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息,请参阅 Amazon SageMaker Studio

Amazon SageMaker 机器学习世系跟踪创建和存储有关机器学习 (ML) 工作流各个步骤(从数据准备到模型部署)的信息。利用跟踪信息,您可以重现工作流步骤,跟踪模型和数据集世系,并建立模型治理和审计标准。

SageMaker 的任务流水线追踪功能可在后端跟踪与模型训练和部署工作流程相关的所有元数据。其中包括您的训练作业、使用的数据集、管道、端点和实际模型。您可以随时查询世系服务,以找到用于训练模型的确切构件。使用这些构件,只要您可以访问所使用的确切数据集,就可以重新创建相同的机器学习工作流来重现模型。一个试验组件会跟踪训练作业。此试验组件包含用作训练作业一部分的所有参数。如果不需要重新运行整个工作流,可以重现训练作业以派生出相同的模型。

借助 SageMaker 世系跟踪,数据科学家和模型构建者可以执行以下操作:

  • 保存模型发现实验的运行历史记录。

  • 通过跟踪用于审计和合规性验证的模型世系构件,建立模型治理。

下图显示了 Amazon SageMaker 在端到端模型训练和部署机器学习工作流中自动创建的世系图示例。

SageMaker 为跟踪工作流程而创建的任务流水线实体元数据示例图。