《表1 人脸检测网络预处理时间对比》

《表1 人脸检测网络预处理时间对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于OpenVX的图像预处理算法的并行化研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

如表1所示,实验结果表明,与Open CV库的CPU版本相比,NEON优化性能却下降,这主要是由于(1)intrinsics指令不能一次性从uint8转换成float,中间涉及u16、u32、f32、f64的类型转换浪费很多cycle;(2)需要对离散的像素进行打包操作。查表法因为计算量的减少能达到1.34倍的加速比,可以计算出分辨率为224×224×3的图像计算量能够变为之前的0.0051。基于Open VX的并行优化由于其SIMD向量化、以及graph的处理能得到12.65倍的加速比。另外,准确率不会因为优化方式的不同而改变,因为算法步骤是相同的。