创建清单文件 - Rekognition

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建清单文件

您可以通过导入 SageMaker AI Ground Truth 格式的清单文件来创建测试或训练数据集。如果您的图像的标签格式不是 SageMaker AI Ground Truth 清单文件,请使用以下信息创建 SageMaker AI Ground Truth 格式的清单文件。

清单文件采用JSON行格式,其中每行都是一个完整的JSON对象,代表图像的标签信息。亚马逊 Rekognition 自定义标签支持 SageMaker AI Ground Truth JSON 清单,其行采用以下格式:

图像级和本地化(边界框)JSON行可以在同一个清单文件中链接在一起。

注意

为了便于阅读,本节中的JSON行示例采用了格式。

当您导入清单文件时,Amazon Rekognition Custom Labels 会应用关于限制、语法和语义的验证规则。有关更多信息,请参阅 清单文件的验证规则

清单文件引用的图像必须位于同一 Amazon S3 存储桶中。清单文件与图像可以位于不同于的 Amazon S3 存储桶中。您可以指定图像在JSON直线source-ref字段中的位置。

Amazon Rekognition 需要具有访问存储图像的 Amazon S3 存储桶的权限。如果使用的是 Amazon Rekognition Custom Labels 为您设置的控制台存储桶,则所需权限已设置完毕。如果使用的不是控制台存储桶,请参阅访问外部 Amazon S3 存储桶

创建清单文件

以下过程创建包含训练和测试数据集的项目。这些数据集是从您创建的训练和测试清单文件创建的。

使用 SageMaker AI Ground Truth 格式的清单文件创建数据集(控制台)
  1. 在控制台存储桶中,创建一个文件夹来存放清单文件。

  2. 在控制台存储桶中,创建一个文件夹来存放图像。

  3. 上传图像至您刚才创建的文件夹。

  4. 为您的训练数据集创建 A SageMaker I Ground Truth 格式的清单文件。有关更多信息,请参阅在清单文件中导入图像级标签清单文件中的物体定位

    重要

    每JSON行中的source-ref字段值必须映射到您上传的图像。

  5. 为您的测试数据集创建 SageMaker AI Ground Truth 格式的清单文件。

  6. 上传清单文件至您刚才创建的文件夹。

  7. 记下清单文件的位置。

  8. 按照使用 SageMaker AI Ground Truth 清单文件创建数据集(控制台)中的说明,使用上传的清单文件创建数据集。对于步骤 8,在 .manifest 文件位置中,输入您在上一步中记下的位置的 Amazon S3 URL。如果你使用的是 AWS SDK,那就去做使用 SageMaker AI Ground Truth 清单文件创建数据集 (SDK)