《表3 不同硬件平台上的结果》
注:batch size=1。
于此同时,严格评估算法在各个硬件平台上的性能,其平台性能以及相应的加速对比结果如表3所示。从运行时间、时间加速比和功耗比三方面分析不同平台的计算性能。在基于FPGA异构平台上,无论是算法速度还是能效比都远远高于当前最新的i9CPU处理器。与14核的i9-9980XE CPU相比,加速比达到了7.51。而在数据精度Int 8的情况下,与Nvidia最新的推理端GPU P40加速器相比,算力只有P40的1/16,在精度只损失不到1%的情况下,运行速度可以达到30帧/s,能耗比也要优于最新的GPU板卡,能效比是Nvidia推理段专用加速器P40的1.2倍,在业界处于领先地位。
图表编号 | XD00204319400 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.01 |
作者 | 袁鸣、柴志雷、甘霖 |
绘制单位 | 江南大学物联网工程学院物联网技术应用教育部工程研究中心、国家超级计算无锡中心、江南大学物联网工程学院物联网技术应用教育部工程研究中心、国家超级计算无锡中心、清华大学计算机科学与技术系 |
更多格式 | 高清、无水印(增值服务) |