《表5 编码自注意力计算粒度压缩实验比较》
解码端的注意力计算粒度不压缩,对编码端的自注意力计算根据信息量的大小分别将每一层的计算粒度压缩比例控制在0.5~1.0与0~1.0之间,对比基线和平均压缩的情况.由于在实际推断时会暂存编码器的输出,所以对于编码端来说,压缩之后推断速度只提升0.10%,但是性能损失了0.47个BLEU值(表5).可见,将CTF方法应用于编码器的自注意力权重计算,获得的加速效果与损失的性能是不成正比的,因此在进行整体压缩的时候对于编码端可以压缩得更少甚至不用压缩.不过CTF方法在速度提升与性能损失上依旧略优于平均压缩的方法.
图表编号 | XD00140612300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.28 |
作者 | 张裕浩、许诺、李垠桥、肖桐、朱靖波 |
绘制单位 | 东北大学自然语言处理实验室、东北大学自然语言处理实验室、东北大学自然语言处理实验室、东北大学自然语言处理实验室、沈阳雅译网络技术有限公司、东北大学自然语言处理实验室、沈阳雅译网络技术有限公司 |
更多格式 | 高清、无水印(增值服务) |