《表1 Olden标准测试程序集分析 (L1-D Cache大小为64 k B, Cache块大小64 B, 4路组相连)》

《表1 Olden标准测试程序集分析 (L1-D Cache大小为64 k B, Cache块大小64 B, 4路组相连)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《链表结构反馈预取机制》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了进一步提高链表结构的预取性能,本文提出反馈预取机制针对链式访存指令中,对单个生产者对应多个消费者的链表结构进行反馈预取,其有效性依赖于:(1)单个生产者对应多个消费者的链表结构访存指令在所有链表结构中的占比;(2)单生产者指令对应多消费者指令的情况发生Cache缺失的个数占所有链表结构发生Cache缺失的比例。本节针对以上两种情况,基于X86体系结构详细分析Olden指针密集型的标准测试集。Olden标准测试程序主要包含中小规模的科学计算(bh、em3d)、过程模拟(health、power)、图(mst、tsp、perimeter、voronoi)、排序等(bisort、treeadd)。Roth等[3]详细分析了Olden标准测试程序,对其中访存指令进行分类,并且统计其Cache性能表现。本文使用X86 Pin工具获取程序执行Trace并使用Sniper模拟器重新分析了该标准测试集,取得的数据如表1所示,与Roth等[3,4]在访存读操作比例、链式访存占所有访存比例、L1-D Cache缺失率等方面有些差别,这是由于实验基于不同的体系结构及使用不同版本编译器导致。表1所统计数据只针对L1-D Cache,Cache大小为64kB,采用4路组相连结构,每个Cache块为64 B大小,采用LRU替换算法。