《表1 不同体系结构不同计算任务参数对比[20]》

《表1 不同体系结构不同计算任务参数对比[20]》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《FPGA技术在生物医学成像中的研究进展》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

众所周知,通用处理器已进入后摩尔时代,而Web服务规模和深度学习却在指数级增长.后智能时代的到来,5G通讯、智慧城市、无人驾驶等行业相继兴起,要求这些用于加速任务的定制硬件可被重新编程来执行不同的计算任务.FPGA作为一种硬件可重构的体系结构,顺应时代发展需求,近年来迅速在华为、微软、阿里、百度等公司的数据服务中心大规模部署,提供强大的计算能力和足够的灵活性[19](图1,表1).图1分别比较了FPGA、ASIC、DSP等算力和能效,表1分别比较了CPU、GPU和FPGA在流式计算任务和密集型计算任务中吞吐量、延时、功耗、灵活性4个指标[20].FPGA全都表现优异,FPGA比CPU甚至是GPU性能指标优异的根本原因是无需指令、无需共享内存的体系结构带来的先天优势.CPU属于冯·诺依曼结构,基本流程包括取指令、译码、执行,都需要共享内存,而共享内存就需要做访问仲裁,任务中断时既要保存当前状态还要需要进行局部访问,每个执行单元必须配有一个单独的缓存,这就要求维持执行任务间缓存的一致性.而对于保存状态的需求,FPGA中的寄存器和片上内存(BRAM)有属于各自的控制逻辑,无需额外的仲裁和缓存.对于通信的需求,基于查找表的FPGA每个逻辑单元的功能在重编程(烧写)时就已经确定,不需要指令和共享内存来通信,因此具有低延时和不必要的额外消耗的优势,同时FPGA拥有数据并行和流水线并行结构,而GPU由于流水线深度受限几乎只有数据并行,FPGA通过牺牲面积换取速度,极大地提高吞吐量和数据带宽[21-23].