管道概述 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

管道概述

Amazon SageMaker 管道是定向无环图 (DAG) 中使用 drag-and-drop用户界面或管道SDK定义的一系列相互关联的步骤。您也可以使用管道定义JSON架构来构建管道。此DAGJSON定义提供了有关管道中每个步骤的要求和关系的信息。管道的结构DAG由步骤之间的数据依赖关系决定。当一个步骤的输出属性作为输入传递给另一个步骤时,就会产生这些数据依赖关系。下图是管道的示例DAG:

管道定向无环图示例 (DAG)。
该示例DAG包括以下步骤:
  1. AbaloneProcess是 Process ing 步骤的一个实例,它对用于训练的数据运行预处理脚本。例如,该脚本可以填充缺失值、标准化数值数据或将数据拆分为训练、验证和测试数据集。

  2. AbaloneTrain,“训练” 步骤的一个实例,用于配置超参数并根据预处理的输入数据训练模型。

  3. AbaloneEval处理” 步骤的另一个实例,用于评估模型的准确性。此步骤显示了数据依赖关系的示例,此步骤使用了的测试数据集输出。AbaloneProcess

  4. AbaloneMSECond是 Condit i on 步骤的一个实例,在本例中,该步骤进行检查以确保模型评估的 mean-square-error结果低于特定限制。如果模型不符合标准,则管道运行停止。

  5. 管道运行将按以下步骤进行:

    1. AbaloneRegisterModel,其中 SageMaker 调用了将模型作为版本化模型包组注册到 Amazon SageMaker 模型注册表的RegisterModel步骤。

    2. AbaloneCreateModel,其中 SageMaker 调用创建模型的CreateModel步骤,为批量转换做准备。在中AbaloneTransform, SageMaker调用 “转换” 步骤,对您指定的数据集生成模型预测。

以下主题描述了基本的流水线概念。有关描述这些概念的实施的教程,请参阅管道操作