《表1 向量化优化方法与加速情况》

《表1 向量化优化方法与加速情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《神威太湖之光加速计算在脑神经网络模拟中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

神经元更新是计算密集型,对神经元信息按序更新,且期间神经元之间相互独立,没有依赖.因此该计算易于并行与扩展,SIMD向量化技术非常适用于神经元更新.神经元更新优化主要利用浮点向量化进行,可实现4个神经元浮点数据向量化操作.为方便向量化优化,我们对SWsnn神经元数据进行整理,减少结构体使用,确保可向量化变量的连续访问.表1显示了SIMD向量化优化方法和加速情况.由表1可知,SIMD向量化在神经元更新的优化最明显,最高可加速约3倍.在神经元更新阶段,由于存在电流/电导更新和脉冲事件提取等串行计算,导致向量化未达到接近4倍的加速效果.