Importation d'étiquettes au niveau de l'image dans des fichiers manifestes - Rekognition

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Importation d'étiquettes au niveau de l'image dans des fichiers manifestes

Pour importer des étiquettes au niveau des images (images étiquetées avec des scènes, des concepts ou des objets ne nécessitant pas d'informations de localisation), vous devez ajouter des JSON lignes au format SageMaker Ground Truth Classification Job Output à un fichier manifeste. Un fichier manifeste est composé d'une ou de plusieurs JSON lignes, une pour chaque image que vous souhaitez importer.

Astuce

Pour simplifier la création d'un fichier manifeste, nous fournissons un script Python qui crée un fichier manifeste à partir d'un CSV fichier. Pour de plus amples informations, veuillez consulter Création d'un fichier manifeste à partir d'un CSV fichier.

Pour créer un fichier manifeste pour des étiquettes au niveau de l’image
  1. Créez un fichier texte vide.

  2. Ajoutez une JSON ligne pour chaque image que vous souhaitez importer. Chaque JSON ligne doit ressembler à ce qui suit.

    {"source-ref":"s3://custom-labels-console-us-east-1-nnnnnnnnnn/gt-job/manifest/IMG_1133.png","TestCLConsoleBucket":0,"TestCLConsoleBucket-metadata":{"confidence":0.95,"job-name":"labeling-job/testclconsolebucket","class-name":"Echo Dot","human-annotated":"yes","creation-date":"2020-04-15T20:17:23.433061","type":"groundtruth/image-classification"}}
  3. Enregistrez le fichier. Vous pouvez utiliser l’extension .manifest, mais cela n’est pas obligatoire.

  4. Créez un jeu de données à l’aide du fichier manifeste que vous avez créé. Pour de plus amples informations, veuillez consulter Pour créer un ensemble de données à l'aide d'un fichier manifeste au format SageMaker Ground Truth (console).

Lignes au niveau de l'image JSON

Dans cette section, nous vous montrons comment créer une JSON ligne pour une seule image. Examinez l’image suivante. Une scène pour l’image suivante pourrait s’appeler Sunrise.

Coucher de soleil sur un lac avec un quai et de petits bateaux, entouré de montagnes.

La JSON ligne de l'image précédente, avec la scène Sunrise, peut être la suivante.

{ "source-ref": "s3://bucket/images/sunrise.png", "testdataset-classification_Sunrise": 1, "testdataset-classification_Sunrise-metadata": { "confidence": 1, "job-name": "labeling-job/testdataset-classification_Sunrise", "class-name": "Sunrise", "human-annotated": "yes", "creation-date": "2020-03-06T17:46:39.176", "type": "groundtruth/image-classification" } }

Notez les informations suivantes.

source-ref

(Obligatoire) Emplacement Amazon S3 de l’image. Le format est "s3://BUCKET/OBJECT_PATH". Les images d’un jeu de données importé doivent être stockées dans le même compartiment Amazon S3.

testdataset-classification_Sunrise

(Obligatoire) Attribut de l’étiquette. Vous choisissez le nom du champ. La valeur du champ (1 dans l’exemple précédent) est un identifiant d’attribut d’étiquette. Elle n’est pas utilisée par Étiquettes personnalisées Amazon Rekognition et peut être n’importe quelle valeur entière. Les métadonnées correspondantes doivent être identifiées par le nom du champ, nom auquel vous devez ajouter -metadata. Par exemple, "testdataset-classification_Sunrise-metadata".

testdataset-classification_Sunrise-métadonnées

(Obligatoire) Métadonnées relatives à l’attribut de l’étiquette. Le nom du champ doit être identique à celui de l’attribut de l’étiquette. La mention -metadata doit être ajoutée à la fin du nom.

confidence

(Obligatoire) Pas utilisé actuellement par Étiquettes personnalisées Amazon Rekognition, mais une valeur comprise entre 0 et 1 doit être fournie.

job-name

(Facultatif) Nom que vous choisissez pour la tâche qui traitera l’image.

class-name

(Obligatoire) Nom de classe que vous choisissez pour la scène ou le concept qui s’applique à l’image. Par exemple, "Sunrise".

human-annotated

(Obligatoire) Spécifiez "yes" si l’annotation a été complétée par un humain. Sinon, spécifiez "no".

creation-date

(Obligatoire) Date et heure universelles coordonnées (UTC) auxquelles l'étiquette a été créée.

type

(Obligatoire) Type de traitement à appliquer à l’image. Pour les étiquettes au niveau de l’image, la valeur est "groundtruth/image-classification".

Ajout de plusieurs étiquettes au niveau de l’image à une image

Vous pouvez ajouter plusieurs étiquettes à une image. Par exemple, ce qui suit JSON ajoute deux étiquettes, football et ballon, à une seule image.

{ "source-ref": "S3 bucket location", "sport0":0, # FIRST label "sport0-metadata": { "class-name": "football", "confidence": 0.8, "type":"groundtruth/image-classification", "job-name": "identify-sport", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256" }, "sport1":1, # SECOND label "sport1-metadata": { "class-name": "ball", "confidence": 0.8, "type":"groundtruth/image-classification", "job-name": "identify-sport", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256" } } # end of annotations for 1 image