《表2 Transformer不同融合方法的运算速度Tab.2 Speed of Transformer with different fusion》

《表2 Transformer不同融合方法的运算速度Tab.2 Speed of Transformer with different fusion》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多层信息融合的神经机器翻译》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据表2可知,算术平均融合方法未引入新的模型参数,对Transformer模型的运算速度影响较小,而线性平均和门机制-层融合方法引入了新的权重参数,运算速度明显降低.由此可知,算术平均融合方法在速度上表现更好.