在清单文件中导入图像级标签 - Rekognition

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在清单文件中导入图像级标签

要导入图像级标签(标有场景、概念或不需要本地化信息的对象的图像),可以将 G SageMaker round Truth 分类作业输出格式JSON行添加到清单文件中。清单文件由一行或多JSON行组成,您要导入的每张图像各占一行。

提示

为了简化清单文件的创建,我们提供了从文件创建清单文件的 Python 脚本。CSV有关更多信息,请参阅 从文件创建清单CSV文件

创建图像级标签的清单文件
  1. 创建一个空文本文件。

  2. 为要导入的每张图像添加一JSON行。每JSON行应与以下内容类似。

    {"source-ref":"s3://custom-labels-console-us-east-1-nnnnnnnnnn/gt-job/manifest/IMG_1133.png","TestCLConsoleBucket":0,"TestCLConsoleBucket-metadata":{"confidence":0.95,"job-name":"labeling-job/testclconsolebucket","class-name":"Echo Dot","human-annotated":"yes","creation-date":"2020-04-15T20:17:23.433061","type":"groundtruth/image-classification"}}
  3. 保存该文件。您可以使用扩展名 .manifest,但不要求必须如此。

  4. 使用您创建的清单文件,创建一个数据集。有关更多信息,请参阅 使用 G SageMaker round Truth 格式的清单文件创建数据集(控制台)

图像级线条 JSON

在本节中,我们将向您展示如何为单个图像创建JSON线条。请考虑以下图像。下图的场景可能叫做 Sunrise

日落的湖面上有码头和小船,周围环绕着群山。

前一幅图像(场景 S unris e)的JSON行可能如下所示。

{ "source-ref": "s3://bucket/images/sunrise.png", "testdataset-classification_Sunrise": 1, "testdataset-classification_Sunrise-metadata": { "confidence": 1, "job-name": "labeling-job/testdataset-classification_Sunrise", "class-name": "Sunrise", "human-annotated": "yes", "creation-date": "2020-03-06T17:46:39.176", "type": "groundtruth/image-classification" } }

请注意以下信息。

source-ref

(必需)图像的 Amazon S3 位置。格式为 "s3://BUCKET/OBJECT_PATH"。所导入数据集中的图像必须存储在同一 Amazon S3 存储桶中。

testdataset-classification_Sunrise

(必需)标签属性。您选择的字段名称。该字段的值(在前面的示例中为 1)是标签属性的标识符。Amazon Rekognition Custom Labels 不使用它,它可以是任何整数值。必须有相应的元数据,这些元数据通过字段名称进行标识,并附有 -metadata。例如,"testdataset-classification_Sunrise-metadata"

testdataset-classification_Sunrise-元数据

(必需)与标签属性相关的元数据。该字段名称必须与标签属性附加 -metadata 之后相同。

confidence

(必需)Amazon Rekognition Custom Labels 目前未使用该属性,但必须为其提供介于 0 和 1 之间的值。

job-name

(可选)您为用于处理图像的作业选择的名称。

class-name

(必需)您为适用于图像的场景或概念选择的类别名称。例如,"Sunrise"

human-annotated

(必需)如果注释由人工完成,请指定 "yes"。否则为 "no"

creation-date

(必填)创建标签的协调世界时 (UTC) 日期和时间。

类型

(必需)应该应用于图像的处理类型。对于图像级标签,该值为 "groundtruth/image-classification"

为图像添加多个图像级标签

可以为图像添加多个标签。例如,以下内容在单个图像中JSON添加了两个标签,即足球

{ "source-ref": "S3 bucket location", "sport0":0, # FIRST label "sport0-metadata": { "class-name": "football", "confidence": 0.8, "type":"groundtruth/image-classification", "job-name": "identify-sport", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256" }, "sport1":1, # SECOND label "sport1-metadata": { "class-name": "ball", "confidence": 0.8, "type":"groundtruth/image-classification", "job-name": "identify-sport", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256" } } # end of annotations for 1 image