《表3 各种并行加速方法耗时》
从表2可以发现,CFSA算法在CPU平台和GPU平台的成像结果略有差异。这主要是因为GPU在双精度浮点数的计算能力上不及CPU,当成像目标点数过多时,可能会产生微小的计算误差,从而造成上述成像结果的偏差[14]。但产生误差的点数仅为总体数据的0.2%,且灰度值偏差最大为1,故可以忽略不计。综上可认为,并行处理前后的CFSA算法具有相同的成像质量。为了验证本文采用的各种并行加速方式的效果,统计不同加速方式下CFSA算法的耗时。表3为数据量为5305×59×64×8bit时,使用各种内存优化和线程优化方法对CFSA算法运行速度的提升效果,其中,运行时间为2.77s的简单并行加速方法是由李溦等[7]提出的。从表3可以看出,本文采用的共享内存、二维线程、优化线程分配、减少内存复制次数和算法优化等方法,均能不同程度地减少CFSA算法的耗时。综合使用上述所有并行处理方法可实现0.17frame·s-1的回波图像处理速度,满足医用超声内镜实时性的要求。
图表编号 | XD0034831700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.25 |
作者 | 肖禹泽、陈晓冬、徐勇、杨晋、盛婧、梁浩林、汪毅 |
绘制单位 | 天津大学精密仪器与光电子工程学院光电信息技术教育部重点实验室、天津大学精密仪器与光电子工程学院光电信息技术教育部重点实验室、天津大学精密仪器与光电子工程学院光电信息技术教育部重点实验室、天津大学精密仪器与光电子工程学院光电信息技术教育部重点实验室、天津大学精密仪器与光电子工程学院光电信息技术教育部重点实验室、天津大学精密仪器与光电子工程学院光电信息技术教育部重点实验室、天津大学精密仪器与光电子工程学院光电信息技术教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |