《高性能计算机体系结构》求取 ⇩

第一章引言1

1.1 技术与体系结构1

1.2它是艺术吗?2

1.2.1 价格因素3

1.2.2 硬件考虑5

1.3高性能技术6

1.3.1 衡量价格7

1.3.2 应用的角色7

1.3.3 VLSI的影响8

1.3.4 技术变化对价格的影响9

1.3.5 算法和体系结构11

1.4 历史的参考12

第二章存贮器系统设计15

2.1 发掘程序的特性15

2.2高速缓冲存贮器19

2.2.1 基本的高速缓存结构19

2.2.2 高速缓存设计20

2.2.3 高速缓存分析:迹生成和迹长度25

2.2.4 高速缓存分析:迹捷联(Trace Stripping)32

2.2.5 替换策略37

2.2.6 高速缓存中的复盖区(Footprints)41

2.2.7 写入高速缓存47

2.2.8 其他性能尺度49

2.2.9 高速缓存性能模型50

2.3虚拟存贮器56

2.3.1 虚存结构57

2.3.2 虚存映象59

2.3.3 改进程序的局部性63

2.3.4 替换算法65

2.3.5 虚存系统中的缓冲效应67

习题70

第三章流水线设计技术77

3.1 流水线设计原理77

3.2 流水线计算机中的存贮器结构86

3.3 流水线计算机的性能88

3.4流水线级的控制95

3.4.1 多功能流水线的设计95

3.4.2 碰撞向量和流水线控制99

3.4.3 最佳性能流水线103

3.4.4 利用延迟提高性能105

3.4.5 消除互锁111

3.5开发流水线技术112

3.5.1 条件转移112

3.5.2 指令的内部超前和延迟116

3.5.3 既有高速缓存又有虚存的机器123

3.5.4 RISC体系结构124

3.6 历史的参考131

习题136

第四章数值应用的特性137

4.1大型数值问题的分类137

4.1.1 连续模型138

4.1.2 粒子模型139

4.2 高性能机器设计的限制140

4.3 连续模型的体系结构145

4.4连续模型的算法145

4.4.1 Cosmic Cube与ILLIAC IV146

4.4.2 数据流的要求150

4.4.3 并行解法153

4.4.4 递归倍增和循环归约155

4.5完全混洗155

4.5.1 完全混洗互连模式159

4.5.2 完全混洗的应用165

4.6 连续模型的体系结构—什么方向?167

习题169

第五章向量计算机169

5.1普通的向量计算机169

5.1.1 多存贮器模块171

5.1.2 中间存贮器176

5.2数值算法的访问模式179

5.2.1 高斯消去法180

5.3 向量机的数据结构技术182

5.4 附属向量处理机187

5.5 稀疏矩阵技术191

5.6 GF—11—一个超高速向量处理机192

5.7 关于向量计算机的最后评注194

习题196

第六章多处理机199

6.1 背景199

6.2多处理机性能202

6.2.1 基本模型——不重叠通信的双处理机203

6.2.2 向N处理机扩展204

6.2.3 统计模型207

6.2.4 带有线性通信价格的模型207

6.2.5 一个乐观的模型—完全重叠的通信208

6.2.6 带有多通信链路的模型210

6.2.7 多处理机模型211

6.3多处理机互连213

6.3.1 总线互连213

6.3.2 环互连216

6.3.3 交叉开关互连218

6.3.4 两维和三维网格221

6.3.5 混洗交换互连和组合开关222

6.3.6 蝶形运算和逆二进变换223

6.3.7 组合网格与取并加(Fetch—and—Add)226

6.3.8 超立方体互连231

6.4 多处理机中的高速缓存相干231

6.5 小结235

习题235

第七章多处理机算法237

7.1简单的并行性237

7.1.1 do par和do seq结构238

7.1.2 阻挡(Barrier)同步239

7.1.3 性能考虑241

7.1.4 增加颗粒度243

7.1.5 启动任务245

7.2同步技术247

7.2.1 用测试并设置(Test—and—Set)同步248

7.2.2 用增量和减量(Increment and Decrement)同步250

7.2.3 用比较并交换(Compare—and—Swap)同步252

7.2.4 用取并加(Fetch—and—Add)同步258

7.2.5 其它支持并行同步的体系结构260

7.2.6 高速缓存相干与同步265

7.3并行搜索—如何采用和不用并行性267

7.3.1 单峰函数最大值的搜索267

7.3.2 并行分支与定界——售贷员巡走问题270

7.3.3 加速和并行的复杂性274

7.4将串行算法变换为并行算法275

7.4.1 相关性分析276

7.4.2 发掘迭代中的并行性277

7.4.3 调度对并行性的影响280

7.5 关于多处理机的最后评注281

习题282

参考文献287

1992《高性能计算机体系结构》由于是年代较久的资料都绝版了,几乎不可能购买到实物。如果大家为了学习确实需要,可向博主求助其电子版PDF文件(由高传善编译 1992 北京:海洋出版社 出版的版本) 。对合法合规的求助,我会当即受理并将下载地址发送给你。