Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Localización de objetos en archivos de manifiesto
Puede importar imágenes etiquetadas con información de localización de objetos añadiendo JSON líneas de formato SageMaker Ground Truth Bounding Box Job Output a un archivo de manifiesto.
La información de la localización representa la ubicación de un objeto en una imagen. La ubicación se representa mediante un cuadro delimitador que rodea el objeto. La estructura del cuadro delimitador incluye las coordenadas superiores izquierdas del cuadro delimitador y su ancho y alto. Una JSON línea con formato de cuadro delimitador incluye cuadros delimitadores para las ubicaciones de uno o más objetos en una imagen y la clase de cada objeto de la imagen.
Un archivo de manifiesto se compone de una o más JSON líneas, cada una de las cuales contiene la información de una sola imagen.
Cómo crear un archivo de manifiesto para la localización de objetos
-
Cree un archivo de texto vacío.
-
Añada una JSON línea para cada imagen que desee importar. Cada JSON línea debe tener un aspecto similar al siguiente.
{"source-ref": "s3://bucket/images/IMG_1186.png", "bounding-box": {"image_size": [{"width": 640, "height": 480, "depth": 3}], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101}, {"class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334}]}, "bounding-box-metadata": {"objects": [{ "confidence": 1}, {"confidence": 1}], "class-map": {"0": "Echo", "1": "Echo Dot"}, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job"}}
-
Guarde el archivo. Puede usar la extensión
.manifest
, pero no es obligatoria. -
Cree un conjunto de datos con el archivo que creó. Para obtener más información, consulte Para crear un conjunto de datos mediante un archivo de manifiesto en formato SageMaker Ground Truth (consola).
Líneas de cuadro delimitadoras de JSON objetos
En esta sección, te mostramos cómo crear una JSON línea para una sola imagen. Por ejemplo, en la siguiente imagen se ven unos cuadros delimitadores alrededor de un Amazon Echo y un Amazon Echo Dot.
La siguiente es la JSON línea del cuadro delimitador de la imagen anterior.
{ "source-ref": "s3://custom-labels-bucket/images/IMG_1186.png", "bounding-box": { "image_size": [{ "width": 640, "height": 480, "depth": 3 }], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101 }, { "class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334 }] }, "bounding-box-metadata": { "objects": [{ "confidence": 1 }, { "confidence": 1 }], "class-map": { "0": "Echo", "1": "Echo Dot" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job" } }
Observe la siguiente información.
source-ref
(Obligatorio) La ubicación de Amazon S3 de la imagen. El formato es "s3://
. Las imágenes de un conjunto de datos importado deben almacenarse en el mismo bucket de Amazon S3. BUCKET
/OBJECT_PATH
"
bounding-box
(Obligatorio) El atributo de etiqueta. Elija el nombre del campo. Incluye el tamaño de la imagen y los cuadros delimitadores de cada objeto detectado en la imagen. Deben estar presentes los metadatos correspondientes identificados por el nombre del campo con el parámetro -metadata adjunto. Por ejemplo, "bounding-box-metadata"
.
- image_size
-
(Obligatorio) Una matriz de un solo elemento que contiene el tamaño de la imagen en píxeles.
-
height: (obligatorio) la altura de la imagen en píxeles.
-
width: (obligatorio) la profundidad de la imagen en píxeles.
-
depth: (obligatorio) el número de canales de la imagen. En el RGB caso de las imágenes, el valor es 3. Etiquetas personalizadas de Amazon Rekognition no lo utiliza actualmente, pero se debe indicar un valor.
-
- annotations
-
(Obligatorio) Un conjunto de información sobre los cuadros delimitadores de cada objeto detectado en la imagen.
-
class_id: (obligatorio) se asigna a la etiqueta en class-map. En el ejemplo anterior, el objeto con el class_id de
1
es el Echo Dot de la imagen. -
top: (obligatorio) la distancia desde la parte superior de la imagen hasta la parte superior del cuadro delimitador, en píxeles.
-
left: (obligatorio) la distancia desde la izquierda de la imagen hasta la izquierda del cuadro delimitador, en píxeles.
-
width: (obligatorio) el ancho del cuadro delimitador, en píxeles.
-
height: (obligatorio) la altura del cuadro delimitador, en píxeles.
-
bounding-box
-metadatos
(Obligatorio) Metadatos sobre el atributo de etiqueta. El nombre del campo debe ser el mismo que el del atributo de etiqueta con el parámetro -metadata adjunto. Un conjunto de información sobre los cuadros delimitadores de cada objeto detectado en la imagen.
- Objects
-
(Obligatorio) Una matriz de objetos presente en la imagen. Se asigna a la matriz de annotations por índice. Etiquetas personalizadas de Amazon Rekognition no utiliza el atributo confidence.
- class-map
-
(Obligatorio) El mapa de clases que se aplica a los objetos detectados en la imagen.
- type
-
(Obligatorio) El tipo de trabajo de clasificación.
"groundtruth/object-detection"
identifica el trabajo como detección de objetos. - creation-date
-
(Obligatorio) Hora universal coordinada (UTC), fecha y hora en que se creó la etiqueta.
- anotado por humanos
-
(Obligatorio) Indique
"yes"
si la anotación la ha completado un humano. De lo contrario,"no"
. - job-name
-
(Opcional) El nombre del trabajo que procesa la imagen.