《表2:Nvidia GPU核心架构技术演进分析》
GP100拥有6个GPC(图形处理簇),每个GPC拥有10个SM,合计有60个SM,每个SM拥有64个CUDA核心(或者说64路SIMD)和16个纹理单元,所以CUDA核心一共有3840个,纹理单元有240个。GP100的设计指标说明了一个重大变革:NVIDIA回归了GK110大核心时代注重双精度运算的设计,而且比之前更加增强——GK110架构中FP64双精度与FP32单精度的比例不过1:3,每组SMX单元中有192个FP32单元,64个FP64单元,但GP100核心中每组SM单元中有64个FP32单元,但有32个FP64单元,FP64与FP32比例是1:2。GP100还支持在一个FP32里同时进行2次FP16的半精度浮点计算,所以对于半精度的理论峰值更是达到了21.2TFlops。 (如图7所示)
图表编号 | XD0021837200 严禁用于非法目的 |
---|---|
绘制时间 | 2018.11.01 |
作者 | 陈云海 |
绘制单位 | 中国电信股份有限公司广东研究院 |
更多格式 | 高清、无水印(增值服务) |