附录 B. 确定论过度自信的实证论证

为了从经验上支持附录 A 中关于确定性过度自信的理论证据，我们比较了每种建模技术的总熵。我们观察到，与确定性案例相比，MC dropout 和带有 MC dropout 的深度融合的总熵更高。这适用于可接受和不可接受的句子。此外，使用对抗技术生成的数据集也是如此。下图显示了总熵的比较。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

附录 A。确定性过度自信的证据

附录 C. 其他注意事项和值得注意的方法