清单文件的验证规则 - Rekognition

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

清单文件的验证规则

当您导入清单文件时,Amazon Rekognition Custom Labels 会应用关于限制、语法和语义的验证规则。G SageMaker round Truth 架构强制执行语法验证。有关更多信息,请参阅输出。以下是限制和语义的验证规则。

注意
  • 所有验证规则累计遵循 20% 的无效规则。如果由于任何组合(例如 15% 的无效图像JSON和 15% 的无效图片)导致导入超过 20% 的限制,则导入将失败。

  • 每个数据集对象都对应于清单中的一行。空行/无效行也算作数据集对象。

  • 重叠度为(测试和训练之间的共用标签数)/(训练标签数)。

限制

验证 限制 出现错误

清单文件大小

最大 1 GB

错误

清单文件的最大行数

一个清单中最多可以包含 250,000 个数据集对象行。

错误

每个标签的有效数据集对象总数的下限

>=1

错误

标签数下限

>=2

错误

标签数上限

<=250

错误

每张图像的最小边界框数

0

每张图像的最大边界框数

50

语义

验证 限制 出现错误

空清单

错误

source-ref 对象丢失/无法访问

对象数量小于 20%

Warning

source-ref 对象丢失/无法访问

对象数量 > 20%

错误

训练数据集中不存在测试标签

标签中至少有 50% 的重叠

错误

在数据集中混合标签与同一标签的对象示例。针对同一类别在数据集对象中进行分类和检测。

没有错误或警告

测试与训练之间的重叠资产

测试数据集与训练数据集之间不应有重叠。

数据集中的图像必须来自同一个存储桶

如果对象位于不同的存储桶中,则会出错

错误