《表2:Nvidia GPU核心架构技术演进分析》

《表2:Nvidia GPU核心架构技术演进分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Nvidia GPU核心架构技术演进分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

GP100拥有6个GPC(图形处理簇),每个GPC拥有10个SM,合计有60个SM,每个SM拥有64个CUDA核心(或者说64路SIMD)和16个纹理单元,所以CUDA核心一共有3840个,纹理单元有240个。GP100的设计指标说明了一个重大变革:NVIDIA回归了GK110大核心时代注重双精度运算的设计,而且比之前更加增强——GK110架构中FP64双精度与FP32单精度的比例不过1:3,每组SMX单元中有192个FP32单元,64个FP64单元,但GP100核心中每组SM单元中有64个FP32单元,但有32个FP64单元,FP64与FP32比例是1:2。GP100还支持在一个FP32里同时进行2次FP16的半精度浮点计算,所以对于半精度的理论峰值更是达到了21.2TFlops。 (如图7所示)