《表2 Transformer不同融合方法的运算速度Tab.2 Speed of Transformer with different fusion》
根据表2可知,算术平均融合方法未引入新的模型参数,对Transformer模型的运算速度影响较小,而线性平均和门机制-层融合方法引入了新的权重参数,运算速度明显降低.由此可知,算术平均融合方法在速度上表现更好.
图表编号 | XD0044619000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.03.28 |
作者 | 周孝青、段湘煜、俞鸿飞、张民 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |