《表2 各种知识蒸馏算法的错误率(单位:%)》
为了验证上述知识蒸馏架构的有效性性,针对基于注意力转移机制[8](Attention Transfer,AT)的知识蒸馏方法以及传统知识蒸馏算法做对比实验。实验结果如表2所示。在实验中使用了控制变量法,保证了不同算法间使用相同的神经网络以及相同的训练方法(随机梯度下降法),等等。
图表编号 | XD00198017100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.15 |
作者 | 郭俊伦、彭书华、李俊杰 |
绘制单位 | 北京信息科技大学自动化学院、北京信息科技大学自动化学院、北京信息科技大学自动化学院 |
更多格式 | 高清、无水印(增值服务) |