《表1 实验配置参数:片上多核处理器Cache访问均衡性研究》
与计算8×8规模下的非一致存储映射和非一致链路分布过程类似,我们基于三种片上规模(4×4/4×8/8×8)的S-NUCA结构,修改并分别实现了三种规模下的面向Cache访问均衡性的NUCA结构.实验方案分为两个部分.首先,我们将GEM5模拟器切换至网络模拟模式(即采用GEM5中的Garnet_standalone Cache一致性协议),即网络中的每个节点的处理核只作为网络流量的注入点,而不模拟运行实际的CPU指令,各个节点按照指定的合成流量模型向网络注入报文.在此模式下,我们将Bank访问概率分布对应的流量模型作为对非一致存储映射的模拟,并结合非一致链路分布设计与S-NUCA结构进行实验对比.第二,我们将GEM5模拟器切换至全系统模式(即在GEM5的Full System模式下采用MESI_Two_Level Cache一致性协议),在每个处理核上运行真实的CPU指令.在此模式下,我们按照计算得到的Cache块数量分布情况修改了存储器到LLC的映射,并在此基础上结合非一致链路分布设计作为实验对比方案.全系统实验配置参数如表1所示.
图表编号 | XD00107157100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 王子聪、陈小文、郭阳 |
绘制单位 | 国防科技大学计算机学院、国防科技大学计算机学院、国防科技大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |