Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Control del flujo de objetos de datos enviados a los trabajadores

Modo de enfoque
Control del flujo de objetos de datos enviados a los trabajadores - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Según el tipo de trabajo de etiquetado que cree, Amazon SageMaker Ground Truth envía los objetos de datos a los trabajadores por lotes o en streaming. Puede controlar el flujo de objetos de datos a los trabajadores de la siguiente forma:

  • Para ambos tipos de trabajos de etiquetado, puede utilizar MaxConcurrentTaskCount para controlar el número total de objetos de datos disponibles para todos los trabajadores en un momento dado en el que se esté ejecutando el trabajo de etiquetado.

  • Para transmitir en streaming los trabajos de etiquetado, puede controlar el flujo de objetos de datos a los trabajadores supervisando y controlando el número de objetos de datos enviados al Amazon SQS asociado a su trabajo de etiquetado.

Utilice las siguientes secciones para obtener más información sobre estas opciones.

Se utiliza MaxConcurrentTaskCount para controlar el flujo de objetos de datos

MaxConcurrentTaskCount define el número máximo de objetos de datos disponibles a la vez en la cola de tareas del portal de trabajo. Si utiliza la consola, este parámetro se establece en 1000. Si utiliza CreateLabelingJob, puede establecer este parámetro en cualquier número entero entre 1 y 5000, ambos inclusive.

Utilice el siguiente ejemplo para entender mejor cómo el número de entradas del archivo de manifiesto, NumberOfHumanWorkersPerDataObject y MaxConcurrentTaskCount definen las tareas que ven los trabajadores en la cola de tareas en la interfaz de usuario del portal de trabajo.

  1. Tiene un archivo de manifiesto de entrada con 600 entradas.

  2. En cada entrada del archivo de manifiesto de entrada, puede utilizar NumberOfHumanWorkersPerDataObject para definir el número de trabajadores humanos que etiquetarán una entrada del archivo de manifiesto de entrada. En este ejemplo se establece el valor de NumberOfHumanWorkersPerDataObject en 3. Esto creará tres tareas diferentes para cada entrada del archivo de manifiesto de entrada. Además, para marcar el objeto como correctamente etiquetado, al menos tres trabajadores diferentes deben etiquetarlo. Esto crea un total de 1800 tareas (600 x 3) para que las completen los trabajadores.

  3. Desea que los trabajadores solo vean 100 tareas a la vez en la cola en la interfaz de usuario del portal de trabajo. Para ello, debe establecer el valor MaxConcurrentTaskCount en 100. A continuación, Ground Truth completará la cola de tareas del portal de trabajos con 100 tareas por trabajador.

  4. Lo que ocurre a continuación depende del tipo de trabajo de etiquetado que cree y de si es un trabajo de etiquetado en transmisión.

    • Trabajo de etiquetado en transmisión: siempre que el número total de objetos disponibles para los trabajadores sea igual a MaxConcurrentTaskCount, todos los objetos del conjunto de datos restantes en el archivo de manifiesto de entrada y que envía en tiempo real mediante Amazon SNS se colocarán en una cola de Amazon SQS. Cuando el número total de objetos disponibles para los trabajadores sea inferior a MaxConcurrentTaskCount menos NumberOfHumanWorkersPerDataObject, se utilizará un nuevo objeto de datos de la cola para crear NumberOfHumanWorkersPerDataObject tareas, que se envían a los trabajadores en tiempo real.

    • Trabajo de etiquetado sin streaming: a medida que los trabajadores terminen de etiquetar un conjunto de objetos, se enviarán NumberOfHumanWorkersPerDataObject veces el número MaxConcurrentTaskCount de tareas nuevas a los trabajadores. Este proceso se repite hasta que se etiqueten todos los objetos de datos del archivo de manifiesto de entrada.

Uso de Amazon SQS para controlar el flujo de objetos de datos para trabajos de etiquetado en transmisión

Cuando crea un trabajo de etiquetado en streaming, se crea automáticamente una cola de Amazon SQS en su cuenta. Los objetos de datos solo se añaden a la cola de Amazon SQS cuando el número total de objetos enviados a los trabajadores es superior a MaxConcurrentTaskCount. De lo contrario, los objetos se envían directamente a los trabajadores.

Puede utilizar esta cola para gestionar el flujo de objetos de datos al trabajo de etiquetado. Para obtener más información, consulte Administración de las solicitudes de etiquetado con una cola de Amazon SQS.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.