《表2 输入不同规模卷积层对结构计算性能效率影响》

《表2 输入不同规模卷积层对结构计算性能效率影响》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《3D-ACC:基于3D集成电路的卷积神经网络加速结构研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于加速器结构的固定不变性,卷积层输入维度的变化是影响结构实际性能效率的重要因素。实验时,假定计算结构的维度p为64,ACMB的深度d为128,每层slice的KERB为512 KB时,从表1中选取不同卷积神经网络模型的典型卷积层,统计输入维度变化对计算结构的性能效率的影响。为了减少启动、收尾时间对计算结构性能效率的影响,实验假设计算时的batch size为16,表2统计了输入不同维度的卷积层时计算结构的实际性能效率。从表2可以看出,卷积层输入维度变化对该计算结构的性能效率影响较大。C1的计算效率远低于C2,原因是C1的卷积核数仅为64,远小于pq=256,无法充分利用计算资源,导致计算资源浪费。C3的计算效率远低于C2,原因是C3的卷积核尺寸仅为1×1,无卷积窗口重叠的复用,在访存带宽受限时,C3的效率低于C2。C4的计算效率高于C3,原因是C4每个卷积核参数量更大,其计算密度更高。C5最低的原因是其卷积核个数仅为32,造成大量计算资源不能被充分利用。由上述分析可知,在访存带宽一定时,输入卷积层的卷积核数量以及尺寸较大时,可显著提升计算结构的计算效率。