《表2 测试程序配置:基于网络负载特征感知的数据流指令调度机制研究》
本实验采用6种科学计算场景的应用作为测试程序,分别是FFT(快速傅里叶变换),2D Stencil,3D Stencil,GEMM(稠密矩阵乘法),LBM(格子玻尔兹曼方法)和SAD(绝对误差和)。各测试程序的配置详情如表2所示。表中的第2列表示每个测试程序的计算规模。FFT表示针对32个点运行16 384个时间步;Stencil3D表示对1个大小为512×512×64的三维矩阵计算100个时间步;矩阵乘法表示2个大小为1 024×1 024的矩阵相乘;Stencil 2D表示对1个大小为512×512的二维矩阵计算100个时间步;LBM表示针对大小为120×120×150的三维矩阵表示的格子计算3 000个时间步;SAD表示输入的2个二维矩阵的大小都是1 920×1 072。表中的第3列表示每种测试程序对应的双精度浮点操作的总个数(其中SAD为定点操作的总个数)。以上选取的测试程序在科学计算领域都十分具有代表性,FFT在计算物理和信号处理领域有十分广泛的应用。Stencil在结构化网格和偏微分方程求解的应用涉及到气象模拟的热力/流体力学领域到电磁学领域。GEMM是数值计算函式集LAPACK和高性能数值计算函式集ScaLAPACK的基础算法,对函数测试集的性能影响十分重要。LBM和SAD分别是流体力学和数字图像处理领域的代表应用。本研究所选取的测试程序既包括通用库的算法,也包括特定领域的专用算法[26-28]。不同的算法覆盖了从访存带宽、运算通量到网络延迟容忍方面的不同特征。
图表编号 | XD0020622000 严禁用于非法目的 |
---|---|
绘制时间 | 2018.12.01 |
作者 | 冯煜晶、欧焱、叶笑春、范东睿、谭旭、唐志敏 |
绘制单位 | 中国科学院计算技术研究所计算机体系结构国家重点实验室、中国科学院大学计算机与控制学院、中国科学院计算技术研究所计算机体系结构国家重点实验室、中国科学院大学计算机与控制学院、中国科学院计算技术研究所计算机体系结构国家重点实验室、中国科学院计算技术研究所计算机体系结构国家重点实验室、中国科学院大学计算机与控制学院、中国科学院计算技术研究所计算机体系结构国家重点实验室、中国科学院大学计算机与控制学院、中国科学院计算技术研究所计算机体系结构国家重点实验室、中国科学院大学计算机与控制学院 |
更多格式 | 高清、无水印(增值服务) |