《表4 方案S0、S1的耗时和加速效果的比较》

《表4 方案S0、S1的耗时和加速效果的比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LBM的单气泡上升现象及并行优化研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

维度划分是CUDA优化加速的其中方法之一。Grid和Block是划分维度的重要单元,通过确定合理的比例使CPU性能发挥最大作用。在优化时,可以将Block划分一维、二维、三维,通常认为维度越高,能划分的线程数就越多,但是由于GPU的线程数有限,并不能盲目对Block进行多维度划分。考虑到计算规模,本文先将Block划分一维,然后再将Block未利用的空间与Grid重新合并形成新的维度,这样充分利用了空闲的线程进行运算,使程序并行效率达到最大化。将未进行维度划分的算法设为S0,已经进行维度划分的算法为S1,演化10000步的计算结果,如表4所示,由表可见,经过优化加速后,流场越大获得的加速比越大。因此,进行大规模数值模拟运算时,引入CUDA并行技术能大大提升程序运行效率,能为更深入研究提供坚实的基础。