使用 Amazon G SageMaker round Truth Plus 为数据添加标签 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon G SageMaker round Truth Plus 为数据添加标签

Amazon G SageMaker round Truth Plus 是一项一站式数据标签服务,它使用专业的员工队伍快速提供高质量的注释,并将成本降低多达40%。使用 SageMaker Ground Truth Plus,数据科学家和业务经理(例如数据运营经理和项目经理)可以创建高质量的培训数据集,而不必自己构建标签应用程序和管理标签工作人员。您可以通过在 Amazon S3 中上传数据和标签要求来开始使用 Amazon G SageMaker round Truth Plus。

为什么要使用 G SageMaker round Truth Plus?

要训练机器学习 (ML) 模型,数据科学家需要大型、高质量的标注数据集。随着机器学习采用率的提高,标注需求也随之增加。这迫使数据科学家花费数周时间来构建数据标注工作流和管理数据标注员工。不幸的是,这会拖慢创新速度并增加成本。为了确保数据科学家能够将时间花在构建、训练和部署机器学习模型上,数据科学家通常会要求由数据运营经理和项目经理构成的其他内部团队生成高质量的训练数据集。但是,这些团队通常无法获得交付高质量训练数据集所需的技能,这会影响机器学习结果。因此,您需要寻找一个数据标注合作伙伴,该合作伙伴可以协助他们在不消耗内部资源的情况下,大规模创建高质量的训练数据集。

当您上传数据时,G SageMaker round Truth Plus 会设置数据标签工作流程并代表您进行操作。从那里,接受过各种机器学习 (ML) 任务培训的专家团队执行数据标注。 SageMaker Ground Truth Plus目前提供两种类型的专业员工:亚马逊雇用的员工队伍和精选的第三方供应商名单。 SageMaker Ground Truth Plus 使您可以灵活地选择标签工作人员。 AWS 专家会根据您的项目要求选择最优秀的标签员工。例如,如果您需要精通为音频文件添加标签的人员,请在提供给 G SageMaker round Truth Plus 的指南中进行指定,该服务会自动选择具有这些技能的标签人员。

重要

SageMaker Ground Truth Plus 不支持 PHI、PCI 或 FedRAMP 认证数据,您不应将这些数据提供给 Groun SageMaker d Truth Plus。

G SageMaker round Truth Plus 是如何运作的?

工作流有五个主要组成部分。

  • 申请项目

  • 创建项目团队

  • 访问项目门户,监控训练数据集的进度并查看已标注数据

  • 创建批处理

  • 接收已标注的数据

如何使用 G SageMaker round Truth Plus?

如果你是 G SageMaker round Truth Plus 的首次用户,请使用开始使用 Amazon G SageMaker round Truth Plus。开始使用。要使用 SageMaker 主机访问 SageMaker Ground Truth Plus,您必须位于美国东部(弗吉尼亚北部)(us-east-1)。