《表3 并行优化效果对比》

《表3 并行优化效果对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于嵌入式GPU的汗孔识别算法并行设计》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

验证异构并行程序的执行效率,将程序独立执行30次后,取平均运行时间作为统计结果。可以看到,在NVIDIA Jetson TX2平台上CUDA并行程序有着显著的加速效果,与在ARM CPU上运行的串行程序相比,提高了接近10倍的运算效率,在脊方向场的计算中甚至达到180倍以上的加速比。由此可见提出的并行设计方案在准确率和运行速度方面均达到了较好的效果。并行程序的优化效果如表3所示。