《表4 算法3(改进的radix-4交错模乘算法)》
进行上述改进之后,步骤(1)与步骤(2)可以流水并行执行。在第一个clk来临时,步骤(1)的O←O+b0·A1mod p、A2←2·A1mod p与步骤(2)的A1←4·A1mod p同时执行。这三者产生的结果,分别是O的更新值,用于E累加的A2,用于O累加的A1。第二个clk开始,O←O+b0·A1mod p需要的O与A1上一周期已经得到;E←E+b1·A2mod p需要的A2也在上一周期得到;A2←2·A1mod p所需要的A1已经在上一周期更新;A1←4·A1mod p所需的A1也在上一周期更新。因此步骤(1)可以和步骤(2)并行运行,但是需要注意的是步骤(2)的运算轮次慢于步骤(1)一个时钟周期。则算法更新为表4所示的算法3。
图表编号 | XD0086307100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.06 |
作者 | 陈琳、唐俊、曲彤洲、尹安琪 |
绘制单位 | 信息工程大学、信息工程大学、信息工程大学、信息工程大学 |
更多格式 | 高清、无水印(增值服务) |