《表5 SSD-300各层的计算性能对比》

《表5 SSD-300各层的计算性能对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向卷积神经网络的高并行度FPGA加速器设计》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

SSD-300硬件部分各层的运行时间及硬件利用率等详细信息如表5所示。在表3的宏参数设置下,CNN加速器的峰值算力为2 304.00 GOPS,计算SSD-300时,实际算力为1 830.33 GOPS,硬件的平均利用率达到79.44%。从表5可以发现,每层的工作负载越大,其硬件利用率越高,这是因为此加速器是专门针对较高算力需求场景而设计的。观察发现,fc-7、conv6-1、conv7-1、conv8-1、conv9-1层的硬件利用率均低于9.5%,这是由于本CNN加速器是针对3×3卷积设计的,对于1×1的卷积效率较低。但是在大部分较高算力应用场景中,1×1的卷积在CNN算法中的计算量占比很低(低于10%),因此,整个CNN算法在本加速器中依然可以达到较高的硬件利用率,如SSD-300,可达到79.44%的硬件利用率。