《表6 硬件资源有限时算法预计耗时Tab.6 Time-consuming of algorithm with limited hardware resources》

《表6 硬件资源有限时算法预计耗时Tab.6 Time-consuming of algorithm with limited hardware resources》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于小型Zynq SoC硬件加速的改进TINY YOLO实时车辆检测算法实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由表5可看出算法主要耗时集中在1、4和6三个Loop中。其中:Loop1为权值数据从DDR3到BRAM的传输;Loop4为feature map从DDR3到BRAM的传输;Loop6为计算和结果传回,由于计算和传出在同一个Loop,故传出数据不耗时,故Loop6主要是DSP48E的乘加运算。Achieved II栏表示实际实现的流水线启动间隔,Iteration_Latency表示单级流水线延时,而Trip_Count表示每个Loop的流水线级数。由表5知,Achieved II均实现最小值1,而Iteration_Latency相比Trip_Count小很多,可以忽略,因此消耗的时钟周期约等于Trip_Count值,其大小随卷积层数变化而改变,故未能在表格中详细列出。表6为预计耗时按功能细分的时间统计。最终得出在有硬件资源限制的小型Zynq So C平台(XC7Z020核心芯片)中预计可实现耗时为33.68 ms。