《表3 计算平台性能比较:基于ARM+FPGA平台的二值神经网络加速方法研究》

《表3 计算平台性能比较:基于ARM+FPGA平台的二值神经网络加速方法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于ARM+FPGA平台的二值神经网络加速方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本节的实验将加速器整体的性能与表3中各种基准线进行了比较,由于原始吞吐量在很大程度上受限于设备尺寸,还比较了功耗和每瓦吞吐量。与m GPU相比两款FPGA的运行时间性能分别提升了8.8和29.5倍,每瓦的吞吐量比m GPU分别高了14.1和9.4倍;与x86处理器相比也分别取得了2和6.7倍的加速效果;而与GPU相比,两款设计在性能上分别相差了18.6和5.5倍,但正如预期的一样,它们的功耗要低得多,每瓦的吞吐量也要高很多。表3中conv1表示第一层的卷积,conv2~5表示二值卷积层,FC1-3是最后的全连接层,最后一行显示了各平台每瓦的效率。