《表1 各节点主要参数指标》
CSRC原型机分两个时间段建设,第一阶段时间为2017年6月至2018年6月,第二阶段为2018年10月至2019年7月.本文采用的硬件系统是CSRC原型机的第一阶段的设备,如图2所示.该原型机主要由1个管理与登录节点、8个计算节点和分布式存储系统组成.其中,计算节点包括2个Purley计算节点、2个GPU计算节点和4个KNL计算节点.所有计算节点之间使用因特尔的OPA(Omni-Path Architecture)交换机相连,用于计算节点之间的数据高速交换.该OPA交换机(型号:100SWE48UF2)共48个端口,每个端口传输速率为100 Gb/s.同时,所有计算节点、分布式存储系统和管理与登录节点之间使用千兆交换机相连,用于计算节点与存储的管理.分布式存储系统由100个8 TB的希捷(型号:ST80000NM0075)硬盘组成,总存储容量为800 TB.其中,400 TB存储部署了NFS文件系统,另外400 TB存储部署了Beegfs文件系统,本文主要使用了Beegfs文件系统的存储.管理与登录节点为戴尔服务器(型号:Dell R830),本地硬盘由5个1 TB的希捷硬盘组成.GPU节点配置了4个GPU显卡(型号:Nvidia Tesla V100).各节点主要参数指标见表1.原型机中的Purley计算节点和KNL计算节点所有CPU核(316个核心)的计算能力为12.6 TFlops,平均0.04 TFlops/核;GPU节点的所有GPU的计算能力约为104 TFlops,平均13 TFlops/GPU.
图表编号 | XD00133413900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 劳保强、安涛 |
绘制单位 | 中国科学院上海天文台、中国科学院上海天文台 |
更多格式 | 高清、无水印(增值服务) |