《表3 各种并行加速方法耗时》

《表3 各种并行加速方法耗时》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于相干系数的实时超声内镜合成孔径成像算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表2可以发现,CFSA算法在CPU平台和GPU平台的成像结果略有差异。这主要是因为GPU在双精度浮点数的计算能力上不及CPU,当成像目标点数过多时,可能会产生微小的计算误差,从而造成上述成像结果的偏差[14]。但产生误差的点数仅为总体数据的0.2%,且灰度值偏差最大为1,故可以忽略不计。综上可认为,并行处理前后的CFSA算法具有相同的成像质量。为了验证本文采用的各种并行加速方式的效果,统计不同加速方式下CFSA算法的耗时。表3为数据量为5305×59×64×8bit时,使用各种内存优化和线程优化方法对CFSA算法运行速度的提升效果,其中,运行时间为2.77s的简单并行加速方法是由李溦等[7]提出的。从表3可以看出,本文采用的共享内存、二维线程、优化线程分配、减少内存复制次数和算法优化等方法,均能不同程度地减少CFSA算法的耗时。综合使用上述所有并行处理方法可实现0.17frame·s-1的回波图像处理速度,满足医用超声内镜实时性的要求。