《表1 芯片层面的关键技术》

《表1 芯片层面的关键技术》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《安防产业中人工智能芯片技术的研究和应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

快速卷积算法的原理是先将参与卷积的feature和weight均进行空间变换,从而将卷积转换为乘积,达到减少乘法次数的目的。以3x3卷积为例,输出2x2个点需要执行的乘法次数为3x3*2*2=36,但在转换域所需的乘法次数仅为4x4=16次,因此单就乘法次数来说运算性能提升了36/16=2.25倍。但是快速算法也有问题,首先,变换与反变换矩阵是高度定制化的,普适性受限,因此通常智能芯片只设计最常见的3x3且stride=1的快速卷积;其次,虽然快速卷积算法减少了乘法次数但引入了额外的变换与反变换运算,这需要额外的成本与功耗开销;再次,变换和反变换通常也会引起一定的精度偏差。