《表2 CNN各层进行运算优化结果》

《表2 CNN各层进行运算优化结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《高性能人脸识别加速器优化设计及FPGA实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本设计采用300个神经元与8个神经元进行全连接,对于最外层循环,使用“#pragma HLS PIPELINE”指令进行流水线优化,内部循环由系统自动展开,循环展开后能够并行执行8次乘加操作,重叠执行不同循环的循环体能够使用更少的硬件资源来提高整个系统的吞吐量,进一步降低系统计算时延。经过运算优化后的结果如表2所示。