《表5 SSD-300各层的计算性能对比》
SSD-300硬件部分各层的运行时间及硬件利用率等详细信息如表5所示。在表3的宏参数设置下,CNN加速器的峰值算力为2 304.00 GOPS,计算SSD-300时,实际算力为1 830.33 GOPS,硬件的平均利用率达到79.44%。从表5可以发现,每层的工作负载越大,其硬件利用率越高,这是因为此加速器是专门针对较高算力需求场景而设计的。观察发现,fc-7、conv6-1、conv7-1、conv8-1、conv9-1层的硬件利用率均低于9.5%,这是由于本CNN加速器是针对3×3卷积设计的,对于1×1的卷积效率较低。但是在大部分较高算力应用场景中,1×1的卷积在CNN算法中的计算量占比很低(低于10%),因此,整个CNN算法在本加速器中依然可以达到较高的硬件利用率,如SSD-300,可达到79.44%的硬件利用率。
图表编号 | XD00201822900 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.10 |
作者 | 王晓峰、蒋彭龙、周辉、赵雄波 |
绘制单位 | 北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室、北京航天自动控制研究所、宇航智能控制技术国家级重点实验室 |
更多格式 | 高清、无水印(增值服务) |