本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
清单文件的验证规则
当您导入清单文件时,Amazon Rekognition Custom Labels 会应用关于限制、语法和语义的验证规则。G SageMaker round Truth 架构强制执行语法验证。有关更多信息,请参阅输出。以下是限制和语义的验证规则。
注意
-
所有验证规则累计遵循 20% 的无效规则。如果由于任何组合(例如 15% 的无效图像JSON和 15% 的无效图片)导致导入超过 20% 的限制,则导入将失败。
-
每个数据集对象都对应于清单中的一行。空行/无效行也算作数据集对象。
-
重叠度为(测试和训练之间的共用标签数)/(训练标签数)。
限制
验证 | 限制 | 出现错误 |
---|---|---|
清单文件大小 |
最大 1 GB |
错误 |
清单文件的最大行数 |
一个清单中最多可以包含 250,000 个数据集对象行。 |
错误 |
每个标签的有效数据集对象总数的下限 |
>=1 |
错误 |
标签数下限 |
>=2 |
错误 |
标签数上限 |
<=250 |
错误 |
每张图像的最小边界框数 |
0 |
无 |
每张图像的最大边界框数 |
50 |
无 |
语义
验证 | 限制 | 出现错误 |
---|---|---|
空清单 |
错误 |
|
source-ref 对象丢失/无法访问 |
对象数量小于 20% |
Warning |
source-ref 对象丢失/无法访问 |
对象数量 > 20% |
错误 |
训练数据集中不存在测试标签 |
标签中至少有 50% 的重叠 |
错误 |
在数据集中混合标签与同一标签的对象示例。针对同一类别在数据集对象中进行分类和检测。 |
没有错误或警告 |
|
测试与训练之间的重叠资产 |
测试数据集与训练数据集之间不应有重叠。 |
|
数据集中的图像必须来自同一个存储桶 |
如果对象位于不同的存储桶中,则会出错 |
错误 |