创建清单文件
可以通过导入 SageMaker Ground Truth 格式的清单文件来创建测试或训练数据集。如果图像的标注格式不是 SageMaker Ground Truth 清单文件,请使用以下信息创建 SageMaker Ground Truth 格式的清单文件。
清单文件采用 JSON 行
-
分类作业输出:用于向图像添加图像级标签。图像级标签定义了图像上的场景、概念或物体(如果不需要物体位置信息)的类别。一张图像可以有多个图像级标签。有关更多信息,请参阅 在清单文件中导入图像级标签。
-
边界框作业输出:用于标注图像上一个或多个物体的类别和位置。有关更多信息,请参阅 清单文件中的物体定位。
图像级和定位(边界框)JSON 行可在同一个清单文件中链接在一起。
注意
本部分的 JSON 行示例为便于阅读调整了格式。
当您导入清单文件时,Amazon Rekognition Custom Labels 会应用关于限制、语法和语义的验证规则。有关更多信息,请参阅 清单文件的验证规则。
清单文件引用的图像必须位于同一 Amazon S3 存储桶中。清单文件与图像可以位于不同于的 Amazon S3 存储桶中。您应在 JSON 行的 source-ref
字段中指定图像的位置。
Amazon Rekognition 需要具有访问存储图像的 Amazon S3 存储桶的权限。如果使用的是 Amazon Rekognition Custom Labels 为您设置的控制台存储桶,则所需权限已设置完毕。如果使用的不是控制台存储桶,请参阅访问外部 Amazon S3 存储桶。
主题
创建清单文件
以下过程创建包含训练和测试数据集的项目。这些数据集是从您创建的训练和测试清单文件创建的。
使用 SageMaker Ground Truth 格式的清单文件创建数据集(控制台)
-
在控制台存储桶中,创建一个文件夹来存放清单文件。
-
在控制台存储桶中,创建一个文件夹来存放图像。
-
上传图像至您刚才创建的文件夹。
-
为训练数据集创建 SageMaker Ground Truth 格式的清单文件。有关更多信息,请参阅在清单文件中导入图像级标签 和清单文件中的物体定位。
重要
每个 JSON 行中的
source-ref
字段值必须映射到您上传的一张图像。 -
为测试数据集创建 SageMaker Ground Truth 格式的清单文件。
-
上传清单文件至您刚才创建的文件夹。
-
记下清单文件的位置。
-
按照使用 SageMaker Ground Truth 清单文件创建数据集(控制台)中的说明,使用上传的清单文件创建数据集。对于步骤 8,在 .manifest 文件位置中,输入您在上一步中记下的该位置的 Amazon S3 URL。如果使用的是 AWS SDK,请执行使用 SageMaker Ground Truth 清单文件创建数据集 (SDK)。