Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Según el tipo de trabajo de etiquetado que cree, Amazon SageMaker Ground Truth envía los objetos de datos a los trabajadores por lotes o en streaming. Puede controlar el flujo de objetos de datos a los trabajadores de la siguiente forma:
-
Para ambos tipos de trabajos de etiquetado, puede utilizar
MaxConcurrentTaskCount
para controlar el número total de objetos de datos disponibles para todos los trabajadores en un momento dado en el que se esté ejecutando el trabajo de etiquetado. -
Para transmitir en streaming los trabajos de etiquetado, puede controlar el flujo de objetos de datos a los trabajadores supervisando y controlando el número de objetos de datos enviados al Amazon SQS asociado a su trabajo de etiquetado.
Utilice las siguientes secciones para obtener más información sobre estas opciones.
Temas
Se utiliza MaxConcurrentTaskCount para controlar el flujo de objetos de datos
MaxConcurrentTaskCount
define el número máximo de objetos de datos disponibles a la vez en la cola de tareas del portal de trabajo. Si utiliza la consola, este parámetro se establece en 1000. Si utiliza CreateLabelingJob
, puede establecer este parámetro en cualquier número entero entre 1 y 5000, ambos inclusive.
Utilice el siguiente ejemplo para entender mejor cómo el número de entradas del archivo de manifiesto, NumberOfHumanWorkersPerDataObject
y MaxConcurrentTaskCount
definen las tareas que ven los trabajadores en la cola de tareas en la interfaz de usuario del portal de trabajo.
-
Tiene un archivo de manifiesto de entrada con 600 entradas.
-
En cada entrada del archivo de manifiesto de entrada, puede utilizar
NumberOfHumanWorkersPerDataObject
para definir el número de trabajadores humanos que etiquetarán una entrada del archivo de manifiesto de entrada. En este ejemplo se establece el valor deNumberOfHumanWorkersPerDataObject
en 3. Esto creará tres tareas diferentes para cada entrada del archivo de manifiesto de entrada. Además, para marcar el objeto como correctamente etiquetado, al menos tres trabajadores diferentes deben etiquetarlo. Esto crea un total de 1800 tareas (600 x 3) para que las completen los trabajadores. -
Desea que los trabajadores solo vean 100 tareas a la vez en la cola en la interfaz de usuario del portal de trabajo. Para ello, debe establecer el valor
MaxConcurrentTaskCount
en 100. A continuación, Ground Truth completará la cola de tareas del portal de trabajos con 100 tareas por trabajador. -
Lo que ocurre a continuación depende del tipo de trabajo de etiquetado que cree y de si es un trabajo de etiquetado en transmisión.
-
Trabajo de etiquetado en transmisión: siempre que el número total de objetos disponibles para los trabajadores sea igual a
MaxConcurrentTaskCount
, todos los objetos del conjunto de datos restantes en el archivo de manifiesto de entrada y que envía en tiempo real mediante Amazon SNS se colocarán en una cola de Amazon SQS. Cuando el número total de objetos disponibles para los trabajadores sea inferior aMaxConcurrentTaskCount
menosNumberOfHumanWorkersPerDataObject
, se utilizará un nuevo objeto de datos de la cola para crearNumberOfHumanWorkersPerDataObject
tareas, que se envían a los trabajadores en tiempo real. -
Trabajo de etiquetado sin streaming: a medida que los trabajadores terminen de etiquetar un conjunto de objetos, se enviarán
NumberOfHumanWorkersPerDataObject
veces el númeroMaxConcurrentTaskCount
de tareas nuevas a los trabajadores. Este proceso se repite hasta que se etiqueten todos los objetos de datos del archivo de manifiesto de entrada.
-
Uso de Amazon SQS para controlar el flujo de objetos de datos para trabajos de etiquetado en transmisión
Cuando crea un trabajo de etiquetado en streaming, se crea automáticamente una cola de Amazon SQS en su cuenta. Los objetos de datos solo se añaden a la cola de Amazon SQS cuando el número total de objetos enviados a los trabajadores es superior a MaxConcurrentTaskCount
. De lo contrario, los objetos se envían directamente a los trabajadores.
Puede utilizar esta cola para gestionar el flujo de objetos de datos al trabajo de etiquetado. Para obtener más información, consulte Administración de las solicitudes de etiquetado con una cola de Amazon SQS.