《表3 解码自注意力计算粒度按不同比例压缩前后的比较》

《表3 解码自注意力计算粒度按不同比例压缩前后的比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《从粗粒度到细粒度的神经机器翻译系统推断加速方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表3可以看出仅对解码自注意力机制,采用CTF方法压缩18.7%时,性能基本不受影响,压缩比例提升一倍之后,速度提升比例也增加了一倍多,同时性能相较于基线系统略有提升.这可能是因为压缩之后有些噪声信息恰好被去掉,没有继续传给下一层,从而使上层的预测更加准确,这也从侧面证实了基线系统每层表达的信息量不一定是最优的.同时注意到,压缩37.5%时CTF方法在性能和速度提升方面均明显优于平均压缩的方法.