视频帧标签作业参考 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

视频帧标签作业参考

使用此页面可了解对象检测和对象跟踪视频帧标注作业。此页面上的信息适用于这两种内置任务类型。

视频帧标注作业的独特之处在于以下几点:

  • 您可以提供准备好进行注释的数据对象(视频帧),也可以提供视频文件并让 Ground Truth 自动提取视频帧。

  • 工作人员可以随时保存工作。

  • 您不能使用 Amazon Mechanical Turk 员工来完成标签任务。

  • Ground Truth 提供了一个工作人员 UI 以及辅助和基本的标注工具,以有助于工作人员完成任务。您不需要提供工作人员任务模板。

使用以下主题了解有关视频帧标注作业的更多信息。

输入数据

视频帧标注作业使用视频帧序列。单个序列是从单个视频中提取的一系列图像。您可以提供自己的视频帧序列,也可以让 Ground Truth 自动从视频文件中提取视频帧序列。要了解更多信息,请参阅提供视频文件

Ground Truth 使用序列文件来识别单个序列中的所有图像。输入清单文件中标识了要在单个标注作业中包含的所有序列。每个序列都用于创建单个工作人员任务。您可以使用 Ground Truth 自动数据设置来自动创建序列文件和输入清单文件。要了解更多信息,请参阅 设置自动视频帧输入数据

要了解如何手动创建序列文件和输入清单文件,请参阅创建视频帧输入清单文件

Job 完成时间

工作人员可能需要数小时才能完成视频和视频帧标注作业。您可以在创建标注作业时设置工作人员可处理每个任务的总时间。您可以为工作人员处理任务设置的最长时间为 7 天。默认值为 3 天。

强烈建议您创建工作人员可在 12 小时内完成的任务。在处理任务时,工作人员必须将工作人员 UI 保持打开状态。他们可以随时保存工作,Ground Truth 每 15 分钟保存一次他们的工作。

使用 SageMaker CreateLabelingJobAPI操作时,请在的TaskTimeLimitInSeconds参数中设置工作人员可以执行任务的总时间HumanTaskConfig

在控制台中创建标注作业时,您可以在选择人力类型和工作团队时指定该时间限制。

任务类型

创建视频对象跟踪或视频对象检测标注作业时,您可以指定希望工作人员在执行标注作业时创建的注释类型。注释类型决定了 Ground Truth 返回的输出数据类型,也定义了标注作业的任务类型

如果要使用API操作创建标注作业 CreateLabelingJob,则使用标签类别配置文件参数指定任务类型annotationType。要了解更多信息,请参阅 带有标签类别和帧属性参考的标签类别配置文件

以下任务类型可用于视频对象跟踪或视频对象检测标注作业:

  • 边界框 – 为工作人员提供了创建边界框注释的工具。边界框是工作人员在对象周围绘制的一个框,用于识别该对象在帧中的像素位置和标签。

  • 折线 – 为工作人员提供了创建折线注释的工具。折线由一系列有序的 x、y 坐标定义。添加到折线上的每个点都用一条线与前一个点相连。折线不必闭合(起点和终点不必相同),线与线之间形成的角度也没有限制。

  • 多边形 – 为工作人员提供了创建多边形注释的工具。多边形是由一系列有序的 x、y 坐标定义的封闭形状。添加到多边形中的每个点都用一条线与前一个点相连,线与线之间形成的角度没有限制。多边形的两条线(边)不能交叉。多边形的起点和终点必须相同。

  • 关键点 – 为工作人员提供了创建关键点注释的工具。关键点是与视频帧中 x、y 坐标相关联的一个点。

人力

创建视频帧标注作业时,需要指定一个工作团队来完成注释任务。您可以从自己的工作人员的私有人力中选择一个工作团队,或者从在 AWS Marketplace中选择的供应商人力中选择一个工作团队。您不能将 Amazon Mechanical Turk 人力用于视频帧标注作业。

要了解供应商人力的更多信息,请参阅订阅供应商员工

要了解如何创建和管理私有人力,请参阅私人劳动力

工作人员用户界面 (UI)

Ground Truth 提供了工作人员用户界面 (UI)、工具和辅助标注功能,以协助工作人员完成视频标注任务。在控制台中创建标注作业时,您可以预览工作人员 UI。

使用API操作创建标注任务时CreateLabelingJob,必须在参数中提供 Ground Truth ARN 提供的参数,HumanTaskUiArn以便为您的任务类型指定工作器用户界面。您可以与 SageMaker RenderUiTemplateAPI操作HumanTaskUiArn一起使用来预览工作器用户界面。

您可以提供工作人员说明、标签和可选属性,工作人员可以使用这些属性来提供有关标签和视频帧的更多信息。这些属性分别称为标签类别属性和帧属性。这些属性都显示在工作人员 UI 中。

标签类别和框架属性

创建视频对象跟踪或视频对象检测标注作业时,可以添加一个或多个标签类别属性帧属性

  • 标签类别属性 – 与一个或多个标签关联的选项(字符串)、自由格式文本框或数值字段的列表。工作人员使用该属性提供有关标签的元数据。

  • 帧属性 – 发送给工作人员进行注释的每个视频帧上显示的选项(字符串)、自由格式文本框或数值字段列表。工作人员使用该属性提供有关视频帧的元数据。

此外,您可以使用标签和帧属性让工作人员在视频帧标签验证作业中验证标签。

使用以下部分了解有关这些属性的更多信息。要了解如何向标注作业添加标签类别和帧属性,请使用所选任务类型页面上的创建标注作业部分。

标签类别属性

为标签添加标签类别属性,让工作人员能够提供更多有关他们创建的注释的信息。标签类别属性可添加到单个标签或所有标签中。当标签类别属性应用于所有标签时,该属性称为全局标签类别属性

例如,如果添加标签类别 car,您可能还希望捕获关于已标注汽车的其他数据,例如,是否遮挡了汽车或汽车的大小。您可以使用标签类别属性以捕获该元数据。在此示例中,如果您将属性 occluded 添加到 car 标签类别中,那么您可以为 occluded 属性分配 partialcompletelyno,并允许工作人员选择其中一个选项。

创建标签验证作业时,您可以将标签类别属性添加到希望工作人员验证的每个标签中。

帧级属性

添加帧属性,使工作人员能够提供有关单个视频帧的更多信息。您添加的每个帧属性都显示在所有帧上。

例如,您可以添加一个 number-frame 属性,让工作人员识别他们在特定帧中看到的对象的数量。

在另一个示例中,您可能希望提供一个自由格式的文本框,使工作人员能够提供问题的答案。

创建标签验证作业时,您可以添加一个或多个帧属性,要求工作人员就视频帧中的所有标签提供反馈。

工作人员说明

您可以提供工作人员说明,以便于工作人员完成视频帧标注任务。在编写说明时,您可能需要涵盖以下主题:

  • 注释对象时的最佳实践和应避免的事项。

  • 提供的标签类别属性(对于对象检测和对象跟踪任务)及其使用方法。

  • 如何使用键盘快捷键节省标注时间。

在创建标签作业时,您可以使用 SageMaker 控制台添加工作人员指令。如果您使用API操作创建标签作业CreateLabelingJob,则可以在标签类别配置文件中指定工作器指令。

除了说明以外,Ground Truth 还提供一个链接以便于工作人员导航和使用工作人员门户。请在工作人员说明中选择任务类型以查看这些说明。

拒绝任务

工作人员可以拒绝任务。

如果说明不清楚、输入数据显示不正确或遇到任务的其他问题,工作人员会拒绝任务。如果每个数据集对象的工作人员数量 (NumberOfHumanWorkersPerDataObject) 拒绝任务,则该数据对象将被标记为过期,并且不会发送给其他工作人员。

视频帧作业许可要求

创建视频帧标签任务时,除了中的权限要求外分配使用 Ground Truth 的IAM权限,还必须向包含输入清单文件的 S3 存储桶添加CORS策略。

CORS您的 S3 存储桶的权限策略

创建视频帧标注作业时,您需要在 S3 中指定输入数据和清单文件所在的存储桶,以及存储输出数据的存储桶。这些存储桶可能是相同的。您必须将以下跨源资源共享 (CORS) 策略附加到您的输入和输出存储桶。如果您使用 Amazon S3 控制台将策略添加到您的存储桶,则必须使用该JSON格式。

JSON

[ { "AllowedHeaders": [ "*" ], "AllowedMethods": [ "GET", "HEAD", "PUT" ], "AllowedOrigins": [ "*" ], "ExposeHeaders": [ "Access-Control-Allow-Origin" ], "MaxAgeSeconds": 3000 } ]

XML

<?xml version="1.0" encoding="UTF-8"?> <CORSConfiguration xmlns="http://s3.amazonaws.com/doc/2006-03-01/"> <CORSRule> <AllowedOrigin>*</AllowedOrigin> <AllowedMethod>GET</AllowedMethod> <AllowedMethod>HEAD</AllowedMethod> <AllowedMethod>PUT</AllowedMethod> <MaxAgeSeconds>3000</MaxAgeSeconds> <ExposeHeader>Access-Control-Allow-Origin</ExposeHeader> <AllowedHeader>*</AllowedHeader> </CORSRule> </CORSConfiguration>

要了解如何向 S3 存储桶添加CORS策略,请参阅如何添加跨域资源共CORS享? 在 Amazon 简单存储服务用户指南中。