《表4 模型训练时卷积层、BN层及ReLU层访存量统计》
从表4可以看出,卷积层、批归一化层及激活层训练时的前向计算过程分别需要访存2D及D数据量。对于前向过程的计算量,卷积层的每个输出结果需要K2 C1C2次浮点乘加,完成卷积层共需要K2 C1C2NC2H2W2次乘加操作;从表2可知,批归一化层前向计算过程共需要8 NC2H2W2次浮点操作;激活层每个结果需要一次浮点比较操作,共需要NC2H2W2次浮点操作。由于K2 C1C2远大于8,因此卷积层的计算量远大于批归一化层,而二者的访存数据量接近,因此批归一化层的计算访存比远低于卷积层。同理可分析反向计算过程中不同层次的计算密度。
图表编号 | XD00139897000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.20 |
作者 | 王吉军、郝子宇、李宏亮 |
绘制单位 | 江南计算技术研究所、江南计算技术研究所、江南计算技术研究所 |
更多格式 | 高清、无水印(增值服务) |