Ground Truth 直播标签职位 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Ground Truth 直播标签职位

如果您想永久将新的数据对象发送到 Amazon G SageMaker round Truth 进行标记,请使用流式标签作业。流式标注作业允许您:

  • 使用持续运行的标注作业,实时向工作人员发送新的数据集对象。只要标注作业处于活动状态,并且有新的对象被发送给该作业,工作人员就会不断接收要标注的新数据对象。

  • 了解已排队并等待标注的对象的数量。使用此信息来控制发送到标注作业的数据对象流。

  • 当工作人员完成对单个数据对象的标注时,实时接收这些对象的标签数据。

Ground Truth 流式标注作业一直处于活动状态,直到手动停止或闲置超过 10 天。您可以在标注作业处于活动状态时,间歇性地向工作人员发送新数据对象。

如果您是 Ground Truth 流式标注作业的新用户,建议您查看工作方式

使用创建流式标注作业了解如何创建流式标注作业。

注意

Ground Truth 直播标签作业只能通过以下方式支持 SageMaker API。

工作方式

创建 Ground Truth 流式标注作业后,该作业会一直处于活动状态,直到手动停止、闲置超过 10 天或无法访问输入数据来源。您可以在该作业处于活动状态时,间歇性地向工作人员发送新数据对象。只要工作人员当前可用的任务总数少于 MaxConcurrentTaskCount 中的值,工作人员就可以继续实时接收新的数据对象。否则,数据对象将被发送到 Ground Truth 在亚马逊简单队列服务 (亚马逊SQS) 中代表您创建的队列以供日后处理。一旦工作人员当前可用的任务总数低于 MaxConcurrentTaskCount,这些任务就会立即发送给工作人员。如果一个数据对象在 14 天后没有发送给工作人员,则该数据对象将过期。您可以查看队列中待处理的任务数量,并调整发送到标注作业的对象数。例如,如果积压的待处理对象超过阈值,您可以降低将对象发送到标注作业的速度。