Uso del personal de Amazon Mechanical Turk - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso del personal de Amazon Mechanical Turk

La fuerza laboral de Amazon Mechanical Turk (Mechanical Turk) es la que proporciona más trabajadores para su trabajo de etiquetado de Amazon Ground SageMaker Truth y para la tarea de revisión humana de Amazon Augmented AI. El personal de Amazon Mechanical Turk es un recurso mundial. Los trabajadores están disponibles 24/7. Por lo general, obtendrá respuestas más rápidas en cuanto a sus tareas de revisión humana y trabajos de etiquetado si usa el personal de Amazon Mechanical Turk.

Cualquier facturación del personal de Amazon Mechanical Turk se gestiona como parte de tu facturación de Ground Truth o Amazon Augmented AI. No tiene que crear una cuenta de Mechanical Turk independiente para utilizar el personal de Amazon Mechanical Turk.

importante

No comparta información confidencial, personal o médica protegida con este personal. No debe utilizar el personal de Amazon Mechanical Turk cuando utilice Amazon A2I junto con servicios AWS HIPAA aptos, como Amazon Textract y Amazon Rekognition, para cargas de trabajo que contengan información de salud protegida.

Puede elegir Mechanical Turk como su personal al crear un trabajo de etiquetado de Ground Truth o un flujo de trabajo de revisión humana de Amazon A2I (definición de flujo). Puede crear un trabajo de etiquetado y un flujo de trabajo de revisión humana mediante la consola de IA y. SageMaker API

Cuando utiliza una API operación para crear un trabajo de etiquetado o un flujo de trabajo de revisión humana, utiliza lo siguiente ARN para el personal de Amazon Mechanical Turk. WorkteamArn regionSustitúyala por la AWS región que esté utilizando para crear el trabajo de etiquetado o los bucles humanos. Por ejemplo, si crea un trabajo de etiquetado en el oeste de EE. UU. (Oregón), sustituya region por us-west-2.

  • arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

Ground Truth y Amazon A2I exigen que los datos de entrada no contengan información de identificación personal (PII) cuando utilice Mechanical Turk. Si utilizas la plantilla de Mechanical Turk y no especificas que tus datos de entrada estén libres de ellosPII, tus tareas de etiquetado de Ground Truth y las tareas de Augmented AI fallarán. Usted especifica que los datos de entrada están libres PII cuando crea un trabajo de etiquetado de Ground Truth y cuando crea un bucle humano Amazon A2I mediante una integración integrada o la StartHumanLoop operación.

Utilice las siguientes secciones para aprender a utilizar Mechanical Turk con estos servicios.

Utilice Mechanical Turk con Ground Truth

Puede utilizar Mechanical Turk con Ground Truth al crear un trabajo de etiquetado mediante la consola o la operación de CreateLabelingJob.

Al crear un trabajo de etiquetado, le recomendamos que ajuste el número de trabajadores que anotan cada objeto de datos en función de la complejidad del trabajo y de la calidad que necesite. Amazon SageMaker Ground Truth utiliza la consolidación de anotaciones para mejorar la calidad de las etiquetas. El uso de más trabajadores puede marcar la diferencia en la calidad de las etiquetas en trabajos de etiquetado más complejas, pero podría carecer de importancia en trabajos más sencillos. Para obtener más información, consulte Consolidación de anotaciones. Ten en cuenta que la consolidación de anotaciones no es compatible con los flujos de trabajo de revisión humana de Amazon A2I.

Utilizar Mechanical Turk al crear un trabajo de etiquetado (consola):
  1. Utilice lo siguiente para crear un trabajo de etiquetado utilizando el área Ground Truth de la consola de SageMaker IA:Crear un trabajo de etiquetado (consola).

  2. Al seleccionar los tipos de trabajadores en la sección Trabajadores, seleccione Amazon Mechanical Turk.

  3. Especifique la cantidad total de tiempo de que disponen los trabajadores para completar una tarea utilizando el Tiempo de espera de tareas.

  4. Especifique la cantidad total de tiempo que una tarea permanece disponible para los trabajadores en Tiempo de espera de tareas. Este es el tiempo que tienen los trabajadores para retomar una tarea antes de que se produzca un error.

  5. Seleccione el Precio por tarea en la lista desplegable. Es la cantidad de dinero que recibe un trabajador por completar una sola tarea.

  6. (Opcional) Si corresponde, selecciona El conjunto de datos no contiene contenido para adultos. SageMaker La IA puede restringir el número de trabajadores de Mechanical Turk que puedan ver tu tarea si contiene contenido para adultos.

  7. Debe leer y confirmar la siguiente declaración marcando la casilla de verificación para utilizar el personal de Mechanical Turk. Si los datos introducidos contienen información confidencial, personal o médica protegida, deberá seleccionar otro personal.

    Usted entiende y acepta que el personal de Mechanical Turk está formado por contratistas independientes ubicados en todo el mundo y que no debe compartir información confidencial, personal o médica protegida con este personal.

  8. (Opcional) Seleccione la casilla de verificación situada junto a Habilitar etiquetado de datos automatizado si quiere activar el etiquetado de datos automatizado. Para obtener más información sobre esta característica, consulte Automatización del etiquetado de datos.

  9. Puede especificar el número de trabajadores por objeto del conjunto de datos en Configuración adicional. Por ejemplo, si introduce 3 en este campo, cada objeto de datos estará etiquetado por 3 trabajadores.

Al crear su trabajo de etiquetado seleccionando Crear, sus tareas de etiquetado se enviarán a los trabajadores de Mechanical Turk.

Para utilizar Mechanical Turk al crear un trabajo de etiquetado ()API:
  1. Utilice lo siguiente para crear un trabajo de etiquetado con la operación de CreateLabelingJob: Crear un trabajo de etiquetado (API).

  2. Utilice lo siguiente para el WorkteamArn. Sustituya region por la AWS región que está utilizando para crear el trabajo de etiquetado.

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. Utilice TaskTimeLimitInSeconds para especificar la cantidad total de tiempo que tienen los trabajadores para completar una tarea.

  4. Utilice TaskAvailabilityLifetimeInSeconds para especificar la cantidad total de tiempo que una tarea está disponible para los trabajadores. Este es el tiempo que tienen los trabajadores para retomar una tarea antes de que se produzca un error.

  5. Utilice NumberOfHumanWorkersPerDataObject para especificar el número de trabajadores por objeto del conjunto de datos.

  6. Utilice PublicWorkforceTaskPrice para establecer el precio por tarea. Es la cantidad de dinero que recibe un trabajador por completar una sola tarea.

  7. Utilice DataAttributes para especificar que los datos de entrada no contienen información confidencial, personal o médica protegida.

    Ground Truth exige que los datos de entrada no contengan información de identificación personal (PII) si utiliza la fuerza laboral de Mechanical Turk. Si utiliza Mechanical Turk y no especifica que los datos de entrada no PII utilicen la FreeOfPersonallyIdentifiableInformation bandera, el trabajo de etiquetado fallará.

    Usa la FreeOfAdultContent bandera para declarar que los datos introducidos no contienen contenido para adultos. SageMaker La IA puede restringir el número de trabajadores de Mechanical Turk que puedan ver tu tarea si contiene contenido para adultos.

Puedes ver ejemplos de cómo usarlo en los siguientes cuadernos, que se encuentran API en GitHub: Ground Truth Jupyter Notebook Examples. Puedes acceder a estos cuadernos con la SageMaker IA Acceso a cuadernos de ejemplo en una instancia de bloc de notas.

Utilice Mechanical Turk con Amazon A2I

Puede especificar que desea utilizar Mechanical Turk con Amazon A2I al crear un flujo de trabajo de revisión humana, también denominado definición de flujo, en la consola o con la operación. CreateFlowDefinition API Cuando utilice este flujo de trabajo de revisión humana para configurar bucles humanos, debe especificar que los datos de entrada estén libres de ellos. PII

Usar Mechanical Turk al crear un flujo de trabajo de revisión humana (consola):
  1. Utilice lo siguiente para crear un flujo de trabajo de revisión humana en la sección Augmented AI de la consola de SageMaker IA:Crear un flujo de trabajo de revisión humana (consola).

  2. Al seleccionar los tipos de trabajadores en la sección Trabajadores, seleccione Amazon Mechanical Turk.

  3. Seleccione el precio por tarea en la lista desplegable. Es la cantidad de dinero que recibe un trabajador por completar una sola tarea.

  4. (Opcional) Puede especificar el número de trabajadores por objeto del conjunto de datos en Configuración adicional. Por ejemplo, si introduce 3 en este campo, cada objeto de datos estará etiquetado por 3 trabajadores.

  5. (Opcional) Especifique la cantidad total de tiempo de que disponen los trabajadores para completar una tarea mediante el Tiempo de espera de tareas.

  6. (Opcional) Especifique la cantidad total de tiempo que una tarea permanece disponible para los trabajadores en Tiempo de vencimiento de tareas. Este es el tiempo que tienen los trabajadores para retomar una tarea antes de que se produzca un error.

  7. Una vez que haya creado su flujo de trabajo de revisión humana, puede usarlo para configurar un bucle humano proporcionando su nombre de recurso de Amazon (ARN) en el parámetroFlowDefinitionArn. Puede configurar un bucle humano mediante una de las API operaciones de un tipo de tarea integrada, o la API operación de tiempo de ejecución de Amazon A2I,. StartHumanLoop Para obtener más información, consulte Crear e iniciar un bucle humano.

    Al configurar su bucle humano, debe especificar que los datos de entrada no contienen información de identificación personal (PII) utilizando el clasificador de FreeOfPersonallyIdentifiableInformation contenido incluido en. DataAttributes Si utilizas Mechanical Turk y no especificas que los datos de entrada estén libres de ellosPII, tus tareas de revisión humana fallarán.

    Usa la FreeOfAdultContent bandera para declarar que los datos introducidos no contienen contenido para adultos. SageMaker La IA puede restringir el número de trabajadores de Mechanical Turk que puedan ver tu tarea si contiene contenido para adultos.

Para usar Mechanical Turk al crear un flujo de trabajo de revisión humana ()API:
  1. Utilice lo siguiente para crear un flujo de trabajo de revisión humana mediante la operación CreateFlowDefinition:Cree un flujo de trabajo de revisión humana (API).

  2. Utilice lo siguiente para el WorkteamArn. Sustituya region por la AWS región que está utilizando para crear el trabajo de etiquetado.

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. Utilice TaskTimeLimitInSeconds para especificar la cantidad total de tiempo que tienen los trabajadores para completar una tarea.

  4. Utilice TaskAvailabilityLifetimeInSeconds para especificar la cantidad total de tiempo que una tarea está disponible para los trabajadores. Este es el tiempo que tienen los trabajadores para retomar una tarea antes de que se produzca un error.

  5. Utilice TaskCount para especificar el número de trabajadores por objeto del conjunto de datos. Por ejemplo, si especifica 3 para este parámetro, 3 trabajadores etiquetarán cada objeto de datos.

  6. Utilice PublicWorkforceTaskPrice para establecer el precio por tarea. Es la cantidad de dinero que recibe un trabajador por completar una sola tarea.

  7. Una vez que haya creado su flujo de trabajo de revisión humana, puede usarlo para configurar un bucle humano proporcionando su nombre de recurso de Amazon (ARN) en el parámetroFlowDefinitionArn. Puede configurar un bucle humano mediante una de las API operaciones de un tipo de tarea integrada, o la API operación de tiempo de ejecución de Amazon A2I,. StartHumanLoop Para obtener más información, consulte Crear e iniciar un bucle humano.

    Al configurar su bucle humano, debe especificar que los datos de entrada no contienen información de identificación personal (PII) utilizando el clasificador de FreeOfPersonallyIdentifiableInformation contenido incluido en. DataAttributes Si utilizas Mechanical Turk y no especificas que los datos de entrada estén libres de ellosPII, tus tareas de revisión humana fallarán.

    Usa la FreeOfAdultContent bandera para declarar que los datos introducidos no contienen contenido para adultos. SageMaker La IA puede restringir el número de trabajadores de Mechanical Turk que puedan ver tu tarea si contiene contenido para adultos.

Puede ver ejemplos de cómo usarlo en las siguientes libretas, que se encuentran API en GitHub: Amazon A2I Jupyter Notebook Examples.

¿Cuándo Mechanical Turk no es compatible?

Este personal no es compatible en los siguientes escenarios. En cada escenario, debe utilizar un personal privado o de un proveedor.

  • Este personal no es compatible con los trabajos de etiquetado de fotogramas de vídeo de Ground Truth ni para los trabajos de etiquetado de nubes de puntos en 3D.

  • No puede utilizar esta fuerza laboral si los datos de entrada contienen información de identificación personal (). PII

  • Mechanical Turk no está disponible en algunas de las regiones AWS especiales. Si corresponde, consulte la documentación de su región especial para obtener más información.