Trabajos de etiquetado en streaming de Ground Truth - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Trabajos de etiquetado en streaming de Ground Truth

Si quieres enviar continuamente nuevos objetos de datos a Amazon SageMaker Ground Truth para que los etiqueten, utiliza un trabajo de etiquetado por streaming. Los trabajos de etiquetado en streaming le permiten:

  • Enviar nuevos objetos del conjunto de datos a los trabajadores en tiempo real mediante un trabajo de etiquetado que se ejecuta permanentemente. Los trabajadores reciben continuamente nuevos objetos de datos para etiquetarlos mientras el trabajo de etiquetado esté activo y se les envíen nuevos objetos.

  • Ver el número de objetos que se han colocado en cola y que están a la espera de ser etiquetados. Utilice esta información para controlar el flujo de objetos de datos que se envían a su trabajo de etiquetado.

  • Recibir los datos de las etiquetas de los objetos de datos individuales en tiempo real a medida que los trabajadores terminen de etiquetarlos.

Los trabajos de etiquetado en streaming de Ground Truth permanecen activos hasta que se detienen manualmente o lleven inactivos durante más de 10 días. Puede enviar nuevos objetos de datos a los trabajadores de forma intermitente mientras el trabajo de etiquetado esté activo.

Si es un usuario nuevo de los trabajos de etiquetado en streaming de Ground Truth, le recomendamos que revise Funcionamiento.

Utilice Crear un trabajo de etiquetado en streaming para aprender a crear un trabajo de etiquetado en streaming.

nota

Los trabajos de etiquetado en streaming de Ground Truth solo son compatibles a través del SageMaker API.

Funcionamiento

Cuando crea un trabajo de etiquetado en streaming de Ground Truth, el trabajo permanece activo hasta que se detiene manualmente, permanece inactivo durante más de 10 días o no puede acceder a los orígenes de datos de entrada. Puede enviar nuevos objetos de datos a los trabajadores de forma intermitente mientras el trabajo esté activo. Un trabajador puede seguir recibiendo nuevos objetos de datos en tiempo real siempre que el número total de tareas disponibles para el trabajador en ese momento sea inferior al valor de MaxConcurrentTaskCount. De lo contrario, el objeto de datos se envía a una cola que Ground Truth crea en su nombre en Amazon Simple Queue Service SQS (Amazon) para su posterior procesamiento. Estas tareas se envían a los trabajadores en cuanto el número total de tareas disponibles en ese momento para un trabajador sea inferior a MaxConcurrentTaskCount. Si un objeto de datos no se envía a un trabajador después de 14 días, caduca. Puede ver el número de tareas pendientes en la cola y ajustar el número de objetos que envía al trabajo de etiquetado. Por ejemplo, puede reducir la velocidad a la que envía los objetos al trabajo de etiquetado si los objetos pendientes superan un umbral.