《表1 芯片层面的关键技术》
快速卷积算法的原理是先将参与卷积的feature和weight均进行空间变换,从而将卷积转换为乘积,达到减少乘法次数的目的。以3x3卷积为例,输出2x2个点需要执行的乘法次数为3x3*2*2=36,但在转换域所需的乘法次数仅为4x4=16次,因此单就乘法次数来说运算性能提升了36/16=2.25倍。但是快速算法也有问题,首先,变换与反变换矩阵是高度定制化的,普适性受限,因此通常智能芯片只设计最常见的3x3且stride=1的快速卷积;其次,虽然快速卷积算法减少了乘法次数但引入了额外的变换与反变换运算,这需要额外的成本与功耗开销;再次,变换和反变换通常也会引起一定的精度偏差。
图表编号 | XD00101407200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.25 |
作者 | 裴朝科、周海林、Guo Dong、杨红明 |
绘制单位 | 上海海思技术有限公司 |
更多格式 | 高清、无水印(增值服务) |