《表2 Smith-Waterman算法性能结果》

提取 ⇩
《表2 Smith-Waterman算法性能结果》
《基于FPGA的Smith-Waterman算法的加速与实现》

比较Smith-waterman算法性能的标准度量方法CUPS(Cell Updates Per Second)表示每秒求得的单元数目。研究者为了加速smith-waterman算法,使用了各种不同的加速平台[10]。有在CPU+GPU的异构平台上进行加速smith-waterman算法,实现的速度只有3072MCUPS.使用纯软件加速最快的版本是SSW,加速效果远不如使用FPGA。在使用FPGA作为加速平台方面,Sirasao使用Xilinx Virtex-7实现该算法速度达到135.4GCUPS。Ernst Joachim Houtgast使用BittWare A10PL4 FPGA实现该算法,速度为107.2GCUPS.使用Intel A10_REF开发板实现的速度为214.4GCUPS,为目前已知实现smith_waterman算法的最快速度。本文实现的速度为294.6G,优于目前已知的最优速度。本文在使用资源时,存在Logic和RAM使用的均衡问题,可再进行优化,用RAM来代替部分logic,更充分的利用资源,因此该方案可实现的速度会更快。为了更加充分的使用资源,把整个代码复制多份即并行模块数,并行运算提高运算速度。最大理论值的计算方法如下:理论最大值=并行模块数*频率*PE数。表一是本文实现该算法在不同并行模块数下的PE个数、频率以及FPGA资源使用情况。表2是该方案实现的速度与其他方案实现速度的对比。

  1. 保存图表

查看“表2 Smith-Waterman算法性能结果”的人还看了

表2 Louvain算法性能
表2 Louvain算法性能
一种基于弱监督学习的线上借贷反欺诈方法
表1 算法资源占用率:图像FAST角点检测算法的FPGA实现与系统集成
表1 算法资源占用率:图像FAST角点检测算法的FPGA实现与系统集成
图像FAST角点检测算法的FPGA实现与系统集成
表3 FPGA加速器性能对比
表3 FPGA加速器性能对比
高性能人脸识别加速器优化设计及FPGA实现
表1 相对误差:一种ω-k算法的FPGA实现
表1 相对误差:一种ω-k算法的FPGA实现
一种ω-k算法的FPGA实现
表2 主要参数:一种ω-k算法的FPGA实现
表2 主要参数:一种ω-k算法的FPGA实现
一种ω-k算法的FPGA实现
表1 SIFT算法与FSIFT算法性能比较
表1 SIFT算法与FSIFT算法性能比较
多特征融合的瓷砖表面缺陷检测算法研究