追踪管道的血统 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

追踪管道的血统

在本教程中,您将使用 Amazon SageMaker Studio 来跟踪亚马逊 SageMaker 机器学习管道的血统。

该管道由 Amazon SageMaker 示例 GitHub 存储库中的 “使用亚马逊 SageMaker 模型构建管道编排任务” 笔记本创建。有关如何创建管道的详细信息,请参阅定义管道

Studio 中的血统跟踪以有向无环图 () DAG 为中心。DAG表示管道中的步骤。从中DAG你可以追踪从任何步骤到任何其他步骤的血统。下图显示了管道中的步骤。这些步骤在 Studio DAG 中显示为。

管道工作流程的步骤示意图。

要在 Amazon SageMaker Studio 控制台中跟踪管道的血统,请根据您使用的是 Studio 还是 Studio Classic 完成以下步骤。

Studio
跟踪管道的世系
  1. 按照启动 Amazon SageMaker Studio 中的说明打开 SageMaker Studio 控制台。

  2. 在左侧导航窗格中,选择管道

  3. (可选)要按名称筛选管道列表,请在搜索字段中输入完整或部分管道名称。

  4. 在 “名称” 列中,选择管道名称以查看有关该管道的详细信息。

  5. 选择 “执行” 选项卡。

  6. 在 “执行” 表的 “名称” 列中,选择要查看的管道执行的名称。

  7. 在 “执行” 页面的右上角,选择垂直省略号,然后选择 “下载管道定义” (JSON)。您可以查看该文件以了解管道图表的定义方式。

  8. 选择 “编辑” 以打开 “流水线设计器”。

  9. 使用画布右上角的大小调整和缩放控件来放大和缩小图表、使图表适应屏幕或将图表扩展到全屏。

  10. 要查看您的训练、验证和测试数据集,请完成以下步骤:

    1. 在管道图中选择 “处理” 步骤。

    2. 在右侧边栏中,选择 “概览” 选项卡。

    3. 文件部分,找到训练、验证和测试数据集的 Amazon S3 路径。

  11. 要查看您的模型工件,请完成以下步骤:

    1. 在管道图中选择 “训练” 步骤。

    2. 在右侧边栏中,选择 “概览” 选项卡。

    3. 文件部分,找到模型工件的 Amazon S3 路径。

  12. 要查找模型包ARN,请完成以下步骤:

    1. 选择 “注册模型” 步骤。

    2. 在右侧边栏中,选择 “概览” 选项卡。

    3. 在 “文件” 部分,ARN找到模型包的。

Studio Classic
跟踪管道的世系
  1. 登录亚马逊 SageMaker Studio 经典版。有关更多信息,请参阅启动 Amazon SageMaker Studio 经典版

  2. 在 Studio 的左侧边栏中,选择主页图标 ( Black square icon representing a placeholder or empty image. )。

  3. 在菜单中,选择管道

  4. 使用搜索框来筛选管道列表。

  5. 选择AbalonePipeline管道以查看管道的执行列表和其他有关流水线的详细信息。

  6. 选择右侧边栏中的 “属性检查器” 图标 ( Black square icon representing a placeholder or empty image. ) 以打开TABLEPROPERTIES窗格,您可以在其中选择要查看的属性。

  7. 选择设置选项卡,然后选择下载管道定义文件。您可以查看该文件以了解管道图表的定义方式。

  8. 在 “执行” 选项卡上,选择执行列表中的第一行以查看其执行图表以及有关该执行的其他详细信息。请注意,该图表与教程开头显示的图表相匹配。

    使用图表右下角的大小调整图标来放大和缩小图表、使图表适应屏幕或将图表扩展到全屏。要聚焦于图表的特定部分,可以选择图表的空白区域,然后将图表拖动到该区域的中心。图表右下角的嵌入图显示您在图表中的位置。

    带有插图和调整大小图标的管道图示例。
  9. 图表选项卡上,选择 AbaloneProcess 步骤以查看有关该步骤的详细信息。

  10. 输出选项卡的文件下方找到训练、验证和测试数据集的 Amazon S3 路径。

    注意

    要获取完整路径,请右键单击路径,然后选择复制单元格内容

    s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/train s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/validation s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/test
  11. 选择 AbaloneTrain 步骤。

  12. 输出选项卡的文件下方找到模型构件的 Amazon S3 路径:

    s3://sagemaker-eu-west-1-acct-id/AbaloneTrain/pipelines-6locnsqz4bfu-AbaloneTrain-NtfEpI0Ahu/output/model.tar.gz
  13. 选择 AbaloneRegisterModel 步骤。

  14. 在 “ARN输出” 选项卡的 “文件” 下方找到模型包的:

    arn:aws:sagemaker:eu-west-1:acct-id:model-package/abalonemodelpackagegroupname/2