《表2 数据依赖计算时间数据》

《表2 数据依赖计算时间数据》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LLVM中间表示的数据依赖并行计算方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验选取了SPEC 2000中的254.gap、183.equake、186.crafty以及176.gcc程序作为实验用例。表2给出了上述实验用例中store指令和load指令数量的统计结果,两者在数据依赖相关指令总数中占比均超过81%。同时,结合GPU端全局内存的合并访存机制以及同线程块内的数据共享,通过线程与指令的一一映射实现了一个线程束同时访问连续32条指令的支持,进一步提高了全局内存的访存效率。当指令数量较少时,线程数量较少,导致计算任务的并行度较低,此时线程对全局内存的访问无法友好地隐藏线程的数据依赖计算操作,合并访存效果不佳;当指令数量较大时,活跃线程较多,数据访问能够较好地隐藏访存延迟,线程能够获取的共享数据资源增多,任务并行度和资源并行度都表现较好。