《表4 PL端的资源利用率》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《面向卷积神经网络的高并行度FPGA加速器设计》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在250 MHz的时钟频率下，PL端的资源利用率如表4所示。可以看出，DSP的利用率非常高，其中2 272个用于PE单元的乘-加法树搭建，2个用于控制单元中的参数计算。由表3中的各类并行度超参数的大小可知，本加速器PE单元一共有4 608个乘法器，其中4 544个乘法器由DSP实现，剩余的64个由查找表（Look Up Table，LUT）实现，这是Vivado为了布线方便、自动优化的结果。DSP的利用量基本决定了CNN加速器的算力，DSP利用率越高，表明CNN加速器的架构设计越合理，越能充分利用硬件平台的片上计算资源。BRAM的利用率适中，表明本文以相对较小的片上缓存做到了DDR交互量最小。触发器（Flip Flop，FF）和LUT的资源利用率都没有超过50%，表明此CNN加速器架构设计合理，不需要过多的逻辑资源便可实现加速器的完整功能，为片上部署其他加速算法和实现用户自定义接口保留了充足的逻辑资源和片上存储资源。

图表编号	XD00201822300 严禁用于非法目的
绘制时间	2021.03.10
作者	王晓峰、蒋彭龙、周辉、赵雄波
绘制单位	北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室
更多格式	高清、无水印（增值服务）