《机群计算》求取 ⇩

1.1 机群并行计算1

1.1.1 机群与并行机1

第一章 机群软件1

1.1.2 机群并行计算的系统软件2

1.1.3 机群并行计算的问题4

1.1.4 机群并行计算的前景5

1.2 机群管理6

1.2.1 机群管理软件的功能6

1.2.2 典型机群管理软件9

1.2.3 机群管理软件比较11

1.2.4 小结14

1.3 分布式操作系统15

1.3.1 典型分布式操作系统15

1.3.2 分布式共享存储器机群并行计算软件17

1.4.1 机群并行编程方法18

1.4 机群计算环境18

1.4.2 报文传递系统19

1.4.3 并行编程环境22

1.5 机群系统23

1.5.1 机群实例24

1.5.2 机群系统评价26

本章参考文献29

第二章 机群上的负载共享33

2.1 空闲工作站共享与调度结构33

2.1.1 引言33

2.1.2 工作站的调度结构34

2.1.3 远程执行设备35

2.2 空闲工作站共享系统Sidle36

2.2.2 调度37

2.2.1 系统组成及工作原理37

2.2.3 远程执行设备38

2.2.4 分布并行PROLOG解释系统DC—PROLOG42

2.2.5 应用42

2.2.6 性能44

2.3 负载平衡46

2.3.1 转移策略46

2.3.2 选择策略46

2.3.3 定位策略47

2.3.4 信息交换策略48

2.3.5 负载平衡算法分类48

2.4 负载指标49

2.4.1 负载指标的选择49

2.4.2 资源利用率与作业响应时间50

2.4.3 资源利用率和CPU队列对作业响应时间的影响的估算52

2.4.4 资源利用率与负载平衡53

2.4.5 小结55

2.5 作业性质的获得55

2.5.1 获得作业性质的方法55

2.5.2 作业的在线跟踪56

2.5.3 作业的CPU利用率及IO利用率的确定59

2.5.4 作业执行时间的估计59

2.5.5 在线跟踪的几个问题61

2.5.6 相关工作63

2.6 智能负载平衡系统ILBOT63

2.6.1 组成63

2.6.2 调度算法64

2.6.3 作业选择策略64

2.6.4 ILBOT中最佳机的搜索66

2.6.5 ILBOT的性能71

本章参考文献72

第三章 机群上的并行计算76

3.1 调度PVM任务76

3.1.1 系统组成76

3.1.2 作业划分与调度算法77

3.1.3 任务池的调度77

3.1.4 动态生成的子任务的调度78

3.1.5 应用80

3.2 协作任务的调度83

3.2.1 引言83

3.2.2 调度模型和算法83

3.2.3 任务调度系统的实现84

3.2.4 性能85

3.3 PVM并行函数库87

3.2.5 相关工作87

3.3.1 任务划分及调度策略88

3.3.2 库函数的实现89

3.3.3 性能90

3.3.4 相关工作比较91

3.4 并行Prolog系统的处理机分配92

3.4.1 引言92

3.4.2 优化的处理机分配算法93

3.4.3 算法的实现94

3.4.4 结果及开销95

3.5 PESS:一个并行计算的支撑系统96

3.5.1 FORK和JOIN的语义96

3.5.2 系统实现97

3.5.3 实例测试99

3.6.1 问题与解100

3.6 远程机群上的并行计算100

3.6.2 远程巨型机代理101

3.6.3 远程并行计算过程101

3.6.4 RP的组成102

3.6.5 计算实例104

3.6.6 相关工作比较105

本章参考文献105

第四章 机群上的检查点和进程迁移108

4.1 分布式系统的检查点算法108

4.1.1 应用108

4.1.2 单进程程序检查点算法109

4.1.3 分布式程序检查点算法110

4.1.4 检查点算法的改进策略与算法112

4.1.5 问题114

4.2 SFT:短冻结时间的一致检查点算法115

4.2.1 系统IPC模型116

4.2.2 SFT算法116

4.2.3 SFT正确性及其性质证明118

4.2.4 SFT实现119

4.2.5 相关工作119

4.3 SCR:文件状态的保存与恢复算法120

4.3.1 SCR算法120

4.3.2 SCR算法的实现123

4.3.3 性能125

4.4 进程迁移127

4.4.1 引言127

4.4.2 典型系统进程迁移机制简介127

4.5 对CONDOR的分析和改进130

4.5.1 引言130

4.5.2 Condor的控制软件131

4.5.3 Condor远程系统调用的实现132

4.5.4 Condor的检查点机制133

4.5.5 Condor的局限性138

4.5.6 对Condor实现的几点改进138

4.6 在PVM中实现进程迁移139

4.6.1 引言139

4.6.2 PVM的进程通信机制139

4.6.3 修改PVM进程通信机制140

4.6.4 进程迁移的控制过程141

4.7 容错143

4.7.1 机群容错方法143

4.7.2 Fail-safe PVM144

4.7.3 Dome146

4.8.1 DPVM调度系统150

4.8 DPVM:支持任务迁移的PVM150

4.8.2 基于检查点的进程迁移154

4.8.3 任务调度156

4.8.4 性能158

4.8.5 相关工作及结论159

本章参考文献160

第五章 PC机群163

5.1 基于LINUX的PC机群163

5.1.1 PC机与工作站163

5.1.2 典型PC机群计算系统164

5.1.3 调度系统的组成164

5.1.4 在Linux上实现DPVM的任务调度功能165

5.1.5 应用的例子166

5.2 PPE95:基于Windows95的并行编程环境166

5.2.1 PPE95系统结构167

5.2.2 进程通信168

5.2.3 状态检测与更新170

5.2.4 调度171

5.2.5 守护进程PVMD173

5.2.6 函数库176

5.2.7 系统启动178

5.2.8 可视化监控界面180

5.2.9 性能182

本章参考文献182

第六章 应用与机间通信184

6.1 机群应用性能184

6.1.1 端到端通信速度184

6.1.2 应用程序性能185

6.1.3 大规模并行性187

6.2 提高机间通信速度188

6.2.1 通信瓶颈188

6.2.2 PVM的通信机制189

6.2.3 ATM网络和其它高速网络190

6.2.4 多通道系统192

6.2.5 共享存储器193

6.2.6 修改网络通信协议195

6.3 用ATM支持机群的高速机间通信195

6.3.1 在ATM上运行PVM195

6.3.2 具有选择重传机制的流量控制198

6.3.3 使用ATM API实现通信的网络性能200

6.3.4 粒度与通信之间的关系201

本章参考文献202

7.1 图形用户接口205

7.1.1 概述205

第七章 可视化并行编程环境205

7.1.2 HeNCE206

7.1.3 VPE207

7.1.4 VPE与HeNCE的对比212

7.2 NCSE212

7.2.1 相关工作213

7.2.2 应用程序的创建及执行214

7.2.3 应用实例216

7.3 PaCE217

7.3.1 结构217

7.3.2 图形程序的编译和运行220

7.3.3 并行程序的运行228

7.3.4 监控功能228

7.3.5 相关工作229

本章参考文献231

第八章 分布式共享存储器机群232

8.1 DSM设计决策的多重性232

8.1.1 分布式共享存储器系统232

8.1.2 DSM算法233

8.1.3 共享的数据233

8.1.4 一致性协议234

8.1.5 实现方法235

8.1.6 实现策略举例235

8.2 基于RM-ODP的DSM系统结构235

8.2.1 RM-ODP235

8.2.2 企业观点下的需求分析236

8.2.3 信息观点下的存储与访问模式237

8.2.4 计算观点下的一致性与透明性239

8.2.5 工程观点下的系统设计242

8.3.1 Mach和Linux243

8.2.6 技术观点243

8.3 在Mach和Linux上实现DSM集成系统243

8.3.2 用户接口244

8.3.3 存储对象属性的设置245

8.3.4 缺页调度程序246

8.4 应用程序的需求分析246

8.4.1 相关工作246

8.4.2 一致性协议247

8.4.3 存储对象分类247

8.4.4 面向存储对象的一致性协议248

8.4.5 例子:写共享250

8.5 DSM集成系统配置的决策机制252

8.5.1 相关工作252

8.5.3 在线跟踪方法253

8.5.2 用户指定方法253

8.5.4 不精确推理方案254

8.6 RTUTH:链表实时更新算法255

8.6.1 相关工作255

8.6.2 基本原理257

8.6.3 更新时机257

8.6.4 链表结构258

8.6.5 链表更新协议258

8.7 DSM系统的优化并发控制259

8.7.1 OCC与CTP260

8.7.2 OCCL与OCC_CTP261

本章参考文献263

附录1 中英文名词对照268

附录2 DPVM源代码选272

附录3 作者们发表的主要的有关文章295

1999《机群计算》由于是年代较久的资料都绝版了,几乎不可能购买到实物。如果大家为了学习确实需要,可向博主求助其电子版PDF文件(由鞠九滨等著 1999 长春:吉林大学出版社 出版的版本) 。对合法合规的求助,我会当即受理并将下载地址发送给你。