在输出数据中查找重复数据删除密钥和 ID - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在输出数据中查找重复数据删除密钥和 ID

您可以在输出数据中看到重复数据删除键和 ID。重复数据删除键由 dataset-objectid-attribute-name 标识。当您使用自己的自定义重复数据删除键时,输出结果类似于下面的内容:

"dataset-objectid-attribute-name": "byo-key", "byo-key": "UniqueId",

如果未指定键,则可通过以下方式找到 Ground Truth 为数据对象分配的重复数据删除 ID。$label-attribute-name-object-id 参数标识重复数据删除 ID。

{ "source-ref":"s3://bucket/prefix/object1", "dataset-objectid-attribute-name":"$label-attribute-name-object-id" "label-attribute-name" :0, "label-attribute-name-metadata": {...}, "$label-attribute-name-object-id":"<service-generated-key>" }

对于 <service-generated-key>,如果数据对象是通过 Amazon S3 配置生成的,Ground Truth 会添加该服务使用的唯一值,并发出一个以 $sequencer 为键值的新字段,显示使用的 Amazon S3 sequencer。如果对象是SNS直接馈送到的,Ground Truth 将使用SNS消息 ID。