创建清单文件 - Rekognition

创建清单文件

可以通过导入 SageMaker Ground Truth 格式的清单文件来创建测试或训练数据集。如果图像的标注格式不是 SageMaker Ground Truth 清单文件,请使用以下信息创建 SageMaker Ground Truth 格式的清单文件。

清单文件采用 JSON 行格式,其中的每一行都是一个代表图像标注信息的完整 JSON 对象。Amazon Rekognition Custom Labels 支持 SageMaker Ground Truth 清单,清单中包含以下格式的 JSON 行:

图像级和定位(边界框)JSON 行可在同一个清单文件中链接在一起。

注意

本部分的 JSON 行示例为便于阅读调整了格式。

当您导入清单文件时,Amazon Rekognition Custom Labels 会应用关于限制、语法和语义的验证规则。有关更多信息,请参阅 清单文件的验证规则

清单文件引用的图像必须位于同一 Amazon S3 存储桶中。清单文件与图像可以位于不同于的 Amazon S3 存储桶中。您应在 JSON 行的 source-ref 字段中指定图像的位置。

Amazon Rekognition 需要具有访问存储图像的 Amazon S3 存储桶的权限。如果使用的是 Amazon Rekognition Custom Labels 为您设置的控制台存储桶,则所需权限已设置完毕。如果使用的不是控制台存储桶,请参阅访问外部 Amazon S3 存储桶

创建清单文件

以下过程创建包含训练和测试数据集的项目。这些数据集是从您创建的训练和测试清单文件创建的。

使用 SageMaker Ground Truth 格式的清单文件创建数据集(控制台)
  1. 在控制台存储桶中,创建一个文件夹来存放清单文件。

  2. 在控制台存储桶中,创建一个文件夹来存放图像。

  3. 上传图像至您刚才创建的文件夹。

  4. 为训练数据集创建 SageMaker Ground Truth 格式的清单文件。有关更多信息,请参阅在清单文件中导入图像级标签清单文件中的物体定位

    重要

    每个 JSON 行中的 source-ref 字段值必须映射到您上传的一张图像。

  5. 为测试数据集创建 SageMaker Ground Truth 格式的清单文件。

  6. 上传清单文件至您刚才创建的文件夹。

  7. 记下清单文件的位置。

  8. 按照使用 SageMaker Ground Truth 清单文件创建数据集(控制台)中的说明,使用上传的清单文件创建数据集。对于步骤 8,在 .manifest 文件位置中,输入您在上一步中记下的该位置的 Amazon S3 URL。如果使用的是 AWS SDK,请执行使用 SageMaker Ground Truth 清单文件创建数据集 (SDK)