《表2 各类并行度的带宽需求比较》
单位:bit/clk
由图3可知,不同的并行度类型每次计算所需的数据量不同,即不同的并行度类型将会导致不同的片上缓存带宽需求。片上缓存带宽直接影响FPGA中BRAM(Block Random Access Memory)和布线资源的消耗量,带宽越大,消耗的资源越多,当片上资源无法满足带宽需求时,将不得不调整数据流以及设计的其他部分。与本文其他部分的数据位宽设置相同,考虑到定点量化[20]的因素,将输入特征、权重数据的位宽设为8 bit,而为了保证计算精度,中间结果的位宽设为12 bit。表2为各类并行度大小为9时,它们对片上缓存带宽需求的比较。从表2中可以看出,卷积核内并行所需带宽最小,仅为输出通道并行和特征图内并行的1/3。从这一方面讲,卷积核内并行是CNN硬件加速器最佳并行方式选择。
图表编号 | XD00201822800 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.10 |
作者 | 王晓峰、蒋彭龙、周辉、赵雄波 |
绘制单位 | 北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室 |
更多格式 | 高清、无水印(增值服务) |