本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在清单文件中导入图像级标签
要导入图像级标签(标有场景、概念或不需要本地化信息的对象的图像),可以将 G SageMaker round Truth 分类作业输出格式JSON行添加到清单文件中。清单文件由一行或多JSON行组成,您要导入的每张图像各占一行。
提示
为了简化清单文件的创建,我们提供了从文件创建清单文件的 Python 脚本。CSV有关更多信息,请参阅 从文件创建清单CSV文件。
创建图像级标签的清单文件
-
创建一个空文本文件。
-
为要导入的每张图像添加一JSON行。每JSON行应与以下内容类似。
{"source-ref":"s3://custom-labels-console-us-east-1-nnnnnnnnnn/gt-job/manifest/IMG_1133.png","TestCLConsoleBucket":0,"TestCLConsoleBucket-metadata":{"confidence":0.95,"job-name":"labeling-job/testclconsolebucket","class-name":"Echo Dot","human-annotated":"yes","creation-date":"2020-04-15T20:17:23.433061","type":"groundtruth/image-classification"}}
-
保存该文件。您可以使用扩展名
.manifest
,但不要求必须如此。 -
使用您创建的清单文件,创建一个数据集。有关更多信息,请参阅 使用 G SageMaker round Truth 格式的清单文件创建数据集(控制台)。
图像级线条 JSON
在本节中,我们将向您展示如何为单个图像创建JSON线条。请考虑以下图像。下图的场景可能叫做 Sunrise。
前一幅图像(场景 S unris e)的JSON行可能如下所示。
{ "source-ref": "s3://bucket/images/sunrise.png", "testdataset-classification_Sunrise": 1, "testdataset-classification_Sunrise-metadata": { "confidence": 1, "job-name": "labeling-job/testdataset-classification_Sunrise", "class-name": "Sunrise", "human-annotated": "yes", "creation-date": "2020-03-06T17:46:39.176", "type": "groundtruth/image-classification" } }
请注意以下信息。
source-ref
(必需)图像的 Amazon S3 位置。格式为 "s3://
。所导入数据集中的图像必须存储在同一 Amazon S3 存储桶中。BUCKET
/OBJECT_PATH
"
testdataset-classification_Sunrise
(必需)标签属性。您选择的字段名称。该字段的值(在前面的示例中为 1)是标签属性的标识符。Amazon Rekognition Custom Labels 不使用它,它可以是任何整数值。必须有相应的元数据,这些元数据通过字段名称进行标识,并附有 -metadata。例如,"testdataset-classification_Sunrise-metadata"
。
testdataset-classification_Sunrise
-元数据
(必需)与标签属性相关的元数据。该字段名称必须与标签属性附加 -metadata 之后相同。
- confidence
-
(必需)Amazon Rekognition Custom Labels 目前未使用该属性,但必须为其提供介于 0 和 1 之间的值。
- job-name
-
(可选)您为用于处理图像的作业选择的名称。
- class-name
-
(必需)您为适用于图像的场景或概念选择的类别名称。例如,
"Sunrise"
。 - human-annotated
-
(必需)如果注释由人工完成,请指定
"yes"
。否则为"no"
。 - creation-date
-
(必填)创建标签的协调世界时 (UTC) 日期和时间。
- 类型
-
(必需)应该应用于图像的处理类型。对于图像级标签,该值为
"groundtruth/image-classification"
。
为图像添加多个图像级标签
可以为图像添加多个标签。例如,以下内容在单个图像中JSON添加了两个标签,即足球和球。
{ "source-ref": "S3 bucket location", "sport0":0, # FIRST label "sport0-metadata": { "class-name": "football", "confidence": 0.8, "type":"groundtruth/image-classification", "job-name": "identify-sport", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256" }, "sport1":1, # SECOND label "sport1-metadata": { "class-name": "ball", "confidence": 0.8, "type":"groundtruth/image-classification", "job-name": "identify-sport", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256" } } # end of annotations for 1 image