《表4 与其他的FPGA工作比较》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Zynq7000 FPGA异构平台的YOLOv2加速器设计与实现》
当前的工作在性能上也超过之前的工作,如表4所示。文献[22]设计了一个7×7的行缓冲,能够适应3×3和7×7的卷积核。由于分别设计卷积模块和全连接模块处理对应层,计算单元的利用率并不高。虽然工作频率很高,但性能仅达到18.82 GOP/s。文献[23]基于Intel的OpenCL采用通用矩阵乘法对矩阵分块,块间并行乘加的方式加速。然而,此方法需要每次将输入特征图和卷积核参数重排序,增加了预处理时延和复杂度。
图表编号 | XD0091259400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 陈辰、柴志雷、夏珺 |
绘制单位 | 江南大学物联网工程学院、江南大学物联网工程学院、数学工程与先进计算国家重点实验室、江南大学物联网工程学院 |
更多格式 | 高清、无水印(增值服务) |