附录 B. 确定论过度自信的实证论证 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

附录 B. 确定论过度自信的实证论证

为了从经验上支持附录 A 中关于确定性过度自信的理论证据,我们比较了每种建模技术的总熵。我们观察到,与确定性案例相比,MC dropout 和带有 MC dropout 的深度融合的总熵更高。这适用于可接受和不可接受的句子。此外,使用对抗技术生成的数据集也是如此。下图显示了总熵的比较。

不同建模技术的总熵比较