Consolidación de anotaciones - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Consolidación de anotaciones

Una anotación es el resultado de la tarea de etiquetado de un trabajador. La consolidación de anotaciones combina las anotaciones de dos o varios trabajadores en una sola etiqueta de los objetos de datos. Las etiquetas, que se asignan a cada objeto del conjunto de datos, son una estimación probabilística de cuál debe ser la verdadera etiqueta. Cada objeto del conjunto de datos normalmente tiene varias anotaciones, pero solo tiene una etiqueta o un conjunto de etiquetas.

Usted decide cuántos trabajadores anotan cada uno de los objetos del conjunto de datos. El uso de más trabajadores puede aumentar la precisión de las etiquetas, pero también el costo del etiquetado. Para obtener más información sobre los precios de Ground Truth, consulta los precios de Amazon SageMaker Ground Truth.

Si utilizas la SageMaker consola de Amazon para crear un trabajo de etiquetado, los siguientes son los valores predeterminados para el número de trabajadores que pueden anotar objetos:

  • Clasificación de texto: 3 trabajadores

  • Clasificación de imágenes: 3 trabajadores

  • Cuadros delimitadores: 5 trabajadores

  • Segmentación semántica: 3 trabajadores

  • Reconocimiento de entidades con nombre: 3 trabajadores

Cuando se utiliza la operación CreateLabelingJob, el número de trabajadores que van a comentar cada objeto de datos se establece con el parámetro NumberOfHumanWorkersPerDataObject. Si desea anular el número predeterminado de trabajadores que van a comentar un objeto de datos, utilice la consola o la operación CreateLabelingJob.

Ground Truth proporciona una función de consolidación de anotaciones para cada una de sus tareas de etiquetado predefinidas: cuadro delimitador, clasificación de imágenes, reconocimiento de entidades de nombres, segmentación semántica y clasificación de texto. Estas son las funciones:

  • La consolidación de anotaciones de varias clases para la clasificación de textos e imágenes aplica una variante del enfoque de maximización de expectativas a las anotaciones. Estima parámetros para cada trabajador y utiliza la inferencia bayesiana para calcular la verdadera clase en función de los anotaciones de clase de trabajadores individuales.

  • La anotación de cuadros delimitadores consolida los cuadros delimitadores de varios trabajadores. Esta función busca los cuadros más parecidos de diferentes trabajadores en función del índice Jaccard (o la intersección sobre la unión) de los cuadros y calcula su promedio.

  • La consolidación de anotaciones de segmentación semántica trata cada píxel en una sola imagen como una clasificación de varias clases. Esta función trata las anotaciones de píxeles de trabajadores como "votos", con más información de los píxeles circundantes incorporada mediante la aplicación de una función de suavizado a la imagen.

  • El reconocimiento de la entidad denominada agrupa las selecciones de texto por similitud de Jaccard y calcula los límites de selección en función del modo, o de la media si este no está claro. La etiqueta se resuelve como la etiqueta de entidad más asignada en el clúster, rompiendo los vínculos mediante una selección aleatoria.

Puede utilizar otros algoritmos para consolidar anotaciones. Para obtener más información, consulte Creación de la función de consolidación de anotaciones.