Envío de datos a un trabajo de etiquetado en transmisión - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Envío de datos a un trabajo de etiquetado en transmisión

Si lo desea, puede enviar los datos de entrada a un trabajo de etiquetado en streaming una sola vez al crear el trabajo de etiquetado mediante un archivo de manifiesto de entrada. Una vez que el trabajo de etiquetado haya comenzado y el estado sea InProgress, puede enviar nuevos objetos de datos a su trabajo de etiquetado en tiempo real mediante el tema de entrada de Amazon SNS y las notificaciones de eventos de Amazon S3.

Envíe los objetos de datos al iniciar el trabajo de etiquetado (una vez):

  • Utilice un archivo de manifiesto de entrada: si lo desea, puede especificar un archivo de manifiesto de entrada en el URI de Amazon S3 en ManifestS3Uri al crear el trabajo de etiquetado en streaming. Ground Truth envía cada objeto de datos del archivo de manifiesto a los trabajadores para que lo etiqueten en cuanto comience el trabajo de etiquetado. Para obtener más información, consulte Crear un archivo de manifiesto (opcional).

    Después de enviar una solicitud para crear el trabajo de etiquetado en streaming, su estado será Initializing. Una vez que el trabajo de etiquetado esté activo, el estado cambiará a InProgress y podrá empezar a utilizar las opciones en tiempo real para enviar objetos de datos adicionales para realizar el etiquetado.

Envíe objetos de datos en tiempo real:

  • Envíe objetos de datos mediante mensajes de Amazon SNS: puede enviar a Ground Truth nuevos objetos de datos para etiquetarlos enviando un mensaje de Amazon SNS. Enviará este mensaje a un tema de entrada de Amazon SNS que cree y especifique al crear su trabajo de etiquetado en streaming. Para obtener más información, consulte Envío de objetos de datos mediante Amazon SNS.

  • Envíe objetos de datos colocándolos en un bucket de Amazon S3: cada vez que añada un nuevo objeto de datos a un bucket de Amazon S3, podrá solicitar a Ground Truth que procese ese objeto para su etiquetado. Para ello, añada una notificación de evento al bucket para que notifique su tema de entrada de Amazon SNS cada vez que se añada (o se cree) un nuevo objeto en ese bucket. Para obtener más información, consulte Envío de objetos de datos mediante Amazon S3. Esta opción no está disponible para los trabajos de etiquetado basados en texto, como la clasificación de textos y el reconocimiento de entidades con nombre.

    importante

    Si utiliza la configuración de Amazon S3, no utilice la misma ubicación de Amazon S3 para la configuración de los datos de entrada y los datos de salida. Al crear un trabajo de etiquetado, debe especificar el prefijo S3 para los datos de salida.

Envío de objetos de datos mediante Amazon SNS

Puede enviar objetos de datos a su trabajo de etiquetado en streaming mediante Amazon Simple Notification Service (Amazon SNS). Amazon SNS es un servicio web que coordina y gestiona la entrega de mensajes hacia y desde los puntos de enlace (por ejemplo, una dirección de correo electrónico o AWS Lambda una función). Un tema de Amazon SNS actúa como un canal de comunicación entre dos o más puntos de conexión. Amazon SNS se utiliza para enviar o publicar nuevos objetos de datos en el tema especificado en el parámetro de CreateLabelingJob SnsTopicArn en InputConfig El formato de estos mensajes es el mismo que el de una sola línea de un archivo de manifiesto de entrada.

Por ejemplo, puede enviar un fragmento de texto a un trabajo de etiquetado y clasificación de texto activo publicándolo en el tema de entrada. El mensaje que publique puede tener un aspecto similar al siguiente:

{"source": "Lorem ipsum dolor sit amet"}

Para enviar un objeto de imagen nuevo a un trabajo de etiquetado y clasificación de imágenes, el mensaje podría tener un aspecto similar al siguiente:

{"source-ref": "s3://amzn-s3-demo-bucket/example-image.jpg"}
nota

También puede incluir claves de deduplicación IDs y deduplicación personalizadas en sus mensajes de Amazon SNS. Para obtener más información, consulte Administración de mensajes duplicados.

Cuando Ground Truth crea tu trabajo de etiquetado en streaming, se suscribe a su tema de entrada de Amazon SNS.

Envío de objetos de datos mediante Amazon S3

Puede enviar uno o más objetos de datos nuevos a un trabajo de etiquetado en streaming colocándolos en un bucket de Amazon S3 que esté configurado con una notificación de eventos de Amazon SNS. Puede configurar un evento para que notifique a su tema de entrada de Amazon SNS cada vez que se cree un objeto nuevo en su bucket. Debe especificar este mismo tema de entrada de Amazon SNS en el parámetro de CreateLabelingJob SnsTopicArn en InputConfig.

Cada vez que configure un bucket de Amazon S3 para enviar notificaciones a Amazon SNS, Ground Truth publicará un evento de prueba, "s3:TestEvent", para garantizar que el tema existe y que el propietario del bucket de Amazon S3 especificado tiene permiso para publicar en el tema especificado. Se recomienda configurar la conexión de Amazon S3 con Amazon SNS antes de iniciar un trabajo de etiquetado en streaming. Si no lo hace, este evento de prueba puede registrarse como un objeto de datos y enviarse a Ground Truth para etiquetarlo.

importante

Si utiliza la configuración de Amazon S3, no utilice la misma ubicación de Amazon S3 para la configuración de los datos de entrada y los datos de salida. Al crear un trabajo de etiquetado, debe especificar el prefijo S3 para los datos de salida.

Para los trabajos de etiquetado basados en imágenes, Ground Truth requiere que todos los buckets de S3 tengan una política de CORS asociada. Para obtener más información, consulte Requisito de CORS para datos de imagen de entrada.

Una vez que haya configurado su bucket de Amazon S3 y creado su trabajo de etiquetado, podrá añadir objetos a su bucket y Ground Truth enviará ese objeto a los trabajadores o lo colocará en su cola de Amazon SQS.

Para obtener más información, consulte Creación de notificaciones de eventos de bucket basadas en Amazon S3 en función del Amazon SNS definido en su trabajo de etiquetado.

importante

Esta opción no está disponible para los trabajos de etiquetado basados en texto, como la clasificación de textos y el reconocimiento de entidades con nombre.