《表2 数据依赖计算时间数据》
实验选取了SPEC 2000中的254.gap、183.equake、186.crafty以及176.gcc程序作为实验用例。表2给出了上述实验用例中store指令和load指令数量的统计结果,两者在数据依赖相关指令总数中占比均超过81%。同时,结合GPU端全局内存的合并访存机制以及同线程块内的数据共享,通过线程与指令的一一映射实现了一个线程束同时访问连续32条指令的支持,进一步提高了全局内存的访存效率。当指令数量较少时,线程数量较少,导致计算任务的并行度较低,此时线程对全局内存的访问无法友好地隐藏线程的数据依赖计算操作,合并访存效果不佳;当指令数量较大时,活跃线程较多,数据访问能够较好地隐藏访存延迟,线程能够获取的共享数据资源增多,任务并行度和资源并行度都表现较好。
图表编号 | XD00134614500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 朱燕、衷璐洁 |
绘制单位 | 首都师范大学信息工程学院、首都师范大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |