《表2 GPU不同网格规模格式计算时间》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于异构平台的通量分裂格式性能研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

s

表1为3种典型格式在CPU执行时间（100、1 000、10 000共3种网格计算规模），由计算结果可知，Van Leer计算效率最高，AUSMPW+计算所需时间略高于与Van Leer，Roe消耗时间最多。表2展示了3种格式在GPU执行时间。在本文的计算的网格规模中，GPU硬件体系结构上，Van Leer计算效率稍高于Roe和AUSMPW+。表3体现了3种格式的加速比，在网格规模较小时，GPU计算时间大于CPU计算。主要原因是网格规模小，无法体现GPU众核体系进行大规模计算的优势。加速比由高到低依次为Roe、AUSMPW+、Van Leer。其影响因素有：Roe格式构造中，需要对矩阵进行计算，其计算量远大于Van Leer和AUSMPW+，而且Roe没有条件语句分支，控制流指令较少，运行中warp分支少，格式适用于GPU单指令多线程运行模式，故Roe加速效果最好；AUSMPW+和Van Leer两种格式存在大量条件分支，不利于GPU运行模式，影响了加速效果；AUSMPW+加速优于Van Leer的原因是AUSMPW+计算量大于Van Leer（从格式构造来看，AUSMPW+是Van Leer的改进，其计算步骤更多更复杂）。从以上分析结果来看，影响格式在异构平台的加速性能主要是格式存在的条件判断分支以及格式的运算量。

图表编号	XD00203518900 严禁用于非法目的
绘制时间	2021.02.25
作者	梁正虹、黄俊、刘志勤、陈波、杨茂
绘制单位	西南科技大学计算机科学与技术学院、西南科技大学计算机科学与技术学院、西南科技大学计算机科学与技术学院、西南科技大学计算机科学与技术学院、西南科技大学计算机科学与技术学院
更多格式	高清、无水印（增值服务）