Primeros pasos: cree un trabajo de etiquetado de cajas delimitadoras con Ground Truth - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Primeros pasos: cree un trabajo de etiquetado de cajas delimitadoras con Ground Truth

Para empezar a usar Amazon SageMaker Ground Truth, sigue las instrucciones de las siguientes secciones. En las siguientes secciones se explica cómo usar la consola para crear un trabajo de etiquetado de cajas delimitadoras, asignar un personal público o privado y enviar el trabajo de etiquetado a su personal. También puede aprender a monitorizar el progreso de un trabajo de etiquetado.

En este vídeo se muestra cómo configurar y utilizar Amazon SageMaker Ground Truth. (Duración: 9:37)

Si desea crear un trabajo de etiquetado personalizado, consulte Flujos de trabajo de etiquetado personalizados para obtener instrucciones.

Antes de crear un trabajo de etiquetado, debe cargar un conjunto de datos a un bucket de Amazon S3. Para obtener más información, consulte Utilizar datos de entrada y salida.

Antes de empezar

Antes de empezar a usar la SageMaker consola para crear un trabajo de etiquetado, debe configurar el conjunto de datos para su uso. Haga lo siguiente:

  1. Guarde dos imágenes como disponibles públicamente HTTPURLs. Las imágenes se utilizan al crear instrucciones para completar una tarea de etiquetado. Las imágenes deben tener una relación de aspecto de alrededor de 2:1. Para este ejercicio, el contenido de las imágenes no es importante.

  2. Cree un bucket de Amazon S3 para almacenar los archivos de entrada y salida. El bucket debe estar en la misma región en la que se ejecute Ground Truth. Anote el nombre del bucket, ya que lo usará durante el paso 2.

    Ground Truth requiere que todos los depósitos S3 que contienen datos de imagen de entrada de tareas de etiquetado tengan una CORS política adjunta. Para obtener más información sobre este cambio, consulte CORSRequisito de entrada de datos de imagen.

  3. Puede crear un IAM rol o dejar que se SageMaker cree un rol con la AmazonSageMakerFullAccessIAMpolítica. Consulte Creación de IAM roles y asigne la siguiente política de permisos al usuario que está creando el trabajo de etiquetado:

    { "Version": "2012-10-17", "Statement": [ { "Sid": "sagemakergroundtruth", "Effect": "Allow", "Action": [ "cognito-idp:CreateGroup", "cognito-idp:CreateUserPool", "cognito-idp:CreateUserPoolDomain", "cognito-idp:AdminCreateUser", "cognito-idp:CreateUserPoolClient", "cognito-idp:AdminAddUserToGroup", "cognito-idp:DescribeUserPoolClient", "cognito-idp:DescribeUserPool", "cognito-idp:UpdateUserPool" ], "Resource": "*" } ] }

Crear un trabajo de etiquetado

En este paso, utilizará la consola para crear un trabajo de etiquetado. Indique a Amazon SageMaker Ground Truth el bucket de Amazon S3 en el que está almacenado el archivo de manifiesto y configure los parámetros del trabajo. Para obtener más información acerca de cómo almacenar datos en un bucket de Amazon S3, consulte Utilizar datos de entrada y salida.

Para crear un trabajo de etiquetado
  1. Abre la SageMaker consola en https://console.aws.amazon.com/sagemaker/.

  2. En el panel de navegación izquierdo, elija Trabajos de etiquetado.

  3. Seleccione Crear un trabajo de etiquetado para comenzar el proceso de creación de trabajo.

  4. En la sección Información general del trabajo, proporcione la siguiente información:

    • Nombre del trabajo: asigne un nombre descriptivo al trabajo de etiquetado. Este nombre se muestra en su lista de trabajos. El nombre debe ser único en su cuenta en una AWS región.

    • Nombre de atributo de la etiqueta: deje esta casilla desactivada, ya que el valor predeterminado es la mejor opción para este trabajo introductorio.

    • Configuración de datos de entrada: seleccione Configuración de datos automatizada. Esta opción permite conectarse automáticamente a los datos de entrada en S3.

    • Ubicación de S3 para conjuntos de datos de entrada: introduzca la ubicación de S3 en la que añadió las imágenes en el paso 1.

    • Ubicación de S3 para conjuntos de datos de salida: ubicación en la que se escriben los datos de salida en S3.

    • Tipo de datos: utilice el menú desplegable para seleccionar Imagen. Ground Truth utilizará todas las imágenes que se encuentren en la ubicación de S3 para los conjuntos de datos de entrada como entrada del trabajo de etiquetado.

    • IAMrol: cree o elija un IAM rol con la AmazonSageMakerFullAccess IAM política adjunta.

  5. En la sección Tipo de tarea, en el campo Categoría de tarea, elija Imagen.

  6. En la Selección de tarea, elija Cuadro delimitador.

  7. Elija Siguiente para ir a la configuración del trabajo de etiquetado.

Seleccione Trabajadores

En este paso se selecciona el personal que se encargará de etiquetar el conjunto de datos. Se recomienda crear una plantilla privada para probar Amazon SageMaker Ground Truth. Utilice direcciones de correo electrónico para invitar a los miembros de su personal. Si crea personal privado en este paso, no podrá importar más adelante su grupo de usuarios de Amazon Cognito. Si desea crear personal privado con un grupo de usuarios de Amazon Cognito, consulte Gestionar un personal privado (Amazon Cognito) y utilice el personal de Mechanical Turk en su lugar en este tutorial.

sugerencia

Para obtener más información sobre las otras opciones de personal que puede utilizar con Ground Truth, consulte Personal.

Para crear personal privado:
  1. En la sección Empleados, elija Privado.

  2. Si es la primera vez que utiliza personal privado, en el campo Direcciones de correo electrónico, especifique hasta 100 direcciones de correo electrónico. Las direcciones tienen que ir separados por coma. Debe incluir su propia dirección de correo electrónico para formar parte del personal y poder ver las tareas de etiquetado de objetos de datos.

  3. En el campo Nombre de la organización, escriba el nombre de su organización. Esta información sirve para personalizar el correo electrónico enviado para invitar a una persona al personal privado. Puede cambiar el nombre de la organización después de crear el grupo de usuarios a través de la consola.

  4. En el campo Correo electrónico de contacto, escriba una dirección de correo electrónico que los miembros del personal utilizarán para notificar problemas con la tarea.

Si usted forma parte del personal privado, recibirá un correo electrónico similar al siguiente. Amazon, Inc. se sustituirá por la organización que haya introducido en el paso 3 del procedimiento anterior. Seleccione el enlace en el correo electrónico para iniciar sesión con la contraseña temporal proporcionada. Cambie la contraseña si se le solicita. Cuando inicie sesión correctamente, verá el portal del trabajador donde aparecen sus tareas de etiquetado.

Ejemplo de invitación por correo electrónico para trabajar en un proyecto de etiquetado.
sugerencia

Puede encontrar el enlace al portal para trabajadores de su fuerza laboral privada en la sección Etiquetado de la fuerza laboral del área Ground Truth de la SageMaker consola. Para ver el enlace, seleccione la pestaña Privado. El enlace se encuentra debajo del URL encabezado de inicio de sesión del portal de etiquetado en el resumen de personal privado.

Si utiliza el personal de Amazon Mechanical Turk para etiquetar el conjunto de datos, se le facturarán las tareas de etiquetado completadas en el conjunto de datos.

Para utilizar el personal de Amazon Mechanical Turk:
  1. En la sección Empleados, elija Público.

  2. Establezca un Precio por tarea.

  3. En su caso, elija El conjunto de datos no incluye contenido para adultos para confirmar que el conjunto de datos de muestra no presenta contenido para adultos. Esta información permite a Amazon SageMaker Ground Truth advertir a los trabajadores externos de Mechanical Turk de que podrían encontrar contenido potencialmente ofensivo en su conjunto de datos.

  4. Seleccione la casilla de verificación situada junto a la siguiente afirmación para confirmar que el conjunto de datos de muestra no contiene ninguna información de identificación personal (PII). Este es un requisito para utilizar Mechanical Turk con Ground Truth. Si los datos de entrada sí los contienenPII, utilice personal privado para este tutorial.

    Usted entiende y acepta que el personal de Amazon Mechanical Turk está formado por contratistas independientes ubicados en todo el mundo y que no debe compartir información confidencial, información personal o información de salud protegida con estos trabajadores.

Configura la herramienta Bounding Box

Por último configure la herramienta de cuadro delimitador para dar instrucciones a sus trabajadores. Puede configurar un título de tarea que describa la tarea y facilite instrucciones de alto nivel a los trabajadores. Puede proporcionar instrucciones rápidas e instrucciones completas. Las instrucciones rápidas se muestran junto a la imagen que se va a etiquetar. Las instrucciones completas contienen instrucciones detalladas para completar la tarea. En este ejemplo solo se proporcionan instrucciones rápidas. Puede ver un ejemplo de instrucciones completas eligiendo Instrucciones completas en la parte inferior de la sección.

Para configurar la herramienta de cuadro delimitador
  1. En el campo Descripción de la tarea, escriba instrucciones breves para la tarea. Por ejemplo:

    Draw a box around any objects in the image.

    Reemplazar objects con el nombre de un objeto que aparece en tus imágenes.

  2. En el campo Etiquetas, escriba un nombre de categoría para los objetos alrededor de los cuales el trabajador debe trazar un cuadro delimitador. Por ejemplo, si le pide al trabajador que trace cuadros alrededor de jugadores de fútbol, puede utilizar "Jugadores de fútbol" en este campo.

  3. La sección Instrucciones breves permite crear instrucciones que se muestran en la pantalla junto a la imagen que los trabajadores están etiquetando. Le recomendamos que incluya un ejemplo de cuadro delimitador bien trazado y otro ejemplo de cuadro delimitador mal trazado. Para crear sus propias instrucciones, siga estos pasos:

    1. Selecciona el texto entre GOODEXAMPLEy el marcador de posición de la imagen. Sustitúyalo por el texto siguiente:

      Draw the box around the object with a small border.

    2. Seleccione el primer marcador de posición de la imagen y elimínelo.

    3. Pulse el botón de imagen y, a continuación, introduzca una HTTPS URL de las imágenes que creó en el paso 1. También es posible insertar imágenes directamente en la sección de instrucciones breves, aunque esta sección tiene una cuota de 100 kilobytes (incluido el texto). Si las imágenes y el texto superan los 100 kilobytes, recibirá un error.

    4. Seleccione el texto entre BADEXAMPLEy el marcador de posición de la imagen. Sustitúyalo por el texto siguiente:

      Don't make the bounding box too large or cut into the object.

    5. Seleccione el segundo marcador de posición de la imagen y elimínelo.

    6. Pulse el botón de imagen y, a continuación, introduzca el HTTPS URL de la otra imagen que creó en el paso 1.

  4. Seleccione Vista previa para obtener una vista previa de la interfaz de usuario del trabajador. La vista previa se abre en una pestaña nueva, por lo que si el navegador bloquea las ventanas emergentes, es posible que tenga que habilitar manualmente la pestaña para que se abra. Cuando añada una o más anotaciones a la vista previa y, a continuación, seleccione Enviar, podrá obtener una vista previa de los datos de salida que crearía la anotación.

  5. Una vez que haya configurado y verificado las instrucciones, seleccione Crear para crear el trabajo de etiquetado.

Si utilizó personal privado, puede navegar hasta el portal de trabajadores en el que inició sesión en Seleccione Trabajadores en este tutorial para ver sus tareas de etiquetado. Las tareas pueden tardar unos minutos en aparecer.

Ahora que ha creado un trabajo de etiquetado, puede supervisarlo o detenerlo.