《表1 向量化优化方法与加速情况》
神经元更新是计算密集型,对神经元信息按序更新,且期间神经元之间相互独立,没有依赖.因此该计算易于并行与扩展,SIMD向量化技术非常适用于神经元更新.神经元更新优化主要利用浮点向量化进行,可实现4个神经元浮点数据向量化操作.为方便向量化优化,我们对SWsnn神经元数据进行整理,减少结构体使用,确保可向量化变量的连续访问.表1显示了SIMD向量化优化方法和加速情况.由表1可知,SIMD向量化在神经元更新的优化最明显,最高可加速约3倍.在神经元更新阶段,由于存在电流/电导更新和脉冲事件提取等串行计算,导致向量化未达到接近4倍的加速效果.
图表编号 | XD00163171900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 栗学磊、朱效民、魏彦杰、冯圣中 |
绘制单位 | 中国科学院深圳先进技术研究院高性能计算研究中心、国家超级计算深圳中心(深圳云计算中心)、高效能服务器和存储技术国家重点实验室、中国科学院深圳先进技术研究院高性能计算研究中心、中国科学院深圳先进技术研究院高性能计算研究中心、国家超级计算深圳中心(深圳云计算中心) |
更多格式 | 高清、无水印(增值服务) |