《表4 算法3(改进的radix-4交错模乘算法)》

《表4 算法3(改进的radix-4交错模乘算法)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《高速可重构高资源利用率统一模单元设计与研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

进行上述改进之后,步骤(1)与步骤(2)可以流水并行执行。在第一个clk来临时,步骤(1)的O←O+b0·A1mod p、A2←2·A1mod p与步骤(2)的A1←4·A1mod p同时执行。这三者产生的结果,分别是O的更新值,用于E累加的A2,用于O累加的A1。第二个clk开始,O←O+b0·A1mod p需要的O与A1上一周期已经得到;E←E+b1·A2mod p需要的A2也在上一周期得到;A2←2·A1mod p所需要的A1已经在上一周期更新;A1←4·A1mod p所需的A1也在上一周期更新。因此步骤(1)可以和步骤(2)并行运行,但是需要注意的是步骤(2)的运算轮次慢于步骤(1)一个时钟周期。则算法更新为表4所示的算法3。