《表3 T1组模式串行和GPU并行子试验模块计算耗时和加速比》

《表3 T1组模式串行和GPU并行子试验模块计算耗时和加速比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一个基于GPU并行加速的海啸数值模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

相比于单计算节点OpenMP并行,单GPU并行表现出了更加出色的加速性能,线性和非线性加速比分别达到67倍和72倍。具体分析串行和GPU并行条件下动量方程、质量连续方程和变量更新函数的加速情况,见表3。不难发现,动量方程因为计算量大,成为了加速效果最显著的模块,线性和非线性加速比分别达到141倍和103倍。另外两个函数模块加速效果基本相当,但远不及动量方程模块,抵消了部分加速增益。