《表6 硬件资源有限时算法预计耗时Tab.6 Time-consuming of algorithm with limited hardware resources》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于小型Zynq SoC硬件加速的改进TINY YOLO实时车辆检测算法实现》
由表5可看出算法主要耗时集中在1、4和6三个Loop中。其中:Loop1为权值数据从DDR3到BRAM的传输;Loop4为feature map从DDR3到BRAM的传输;Loop6为计算和结果传回,由于计算和传出在同一个Loop,故传出数据不耗时,故Loop6主要是DSP48E的乘加运算。Achieved II栏表示实际实现的流水线启动间隔,Iteration_Latency表示单级流水线延时,而Trip_Count表示每个Loop的流水线级数。由表5知,Achieved II均实现最小值1,而Iteration_Latency相比Trip_Count小很多,可以忽略,因此消耗的时钟周期约等于Trip_Count值,其大小随卷积层数变化而改变,故未能在表格中详细列出。表6为预计耗时按功能细分的时间统计。最终得出在有硬件资源限制的小型Zynq So C平台(XC7Z020核心芯片)中预计可实现耗时为33.68 ms。
图表编号 | XD0035549600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.10 |
作者 | 张雲轲、刘丹 |
绘制单位 | 电子科技大学电子科学技术研究院、电子科技大学电子科学技术研究院 |
更多格式 | 高清、无水印(增值服务) |
查看“表6 硬件资源有限时算法预计耗时Tab.6 Time-consuming of algorithm with limited hardware resources”的人还看了
- 表6 density-ORB算法与其他算法的性能比较Tab.6 Performance comparison between density-ORB algorithm and other algorithms