《表1 PARA-AC(并行)与原始AC匹配算法(串行)的耗时对比》

《表1 PARA-AC(并行)与原始AC匹配算法(串行)的耗时对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《PARA-AC:一种基于AC自动机的高性能匹配算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
(单位:s)

通过以上分析可知,文本量较大时,可以最完全发挥并行AC算法的潜力,选取进程数为40时,模式串的长度为(4、16、64、256)时的算法在80 MB、20 MB、4 MB、1 MB以及128 KB文件上的性能测试数据如表1所示。从表1可以看出,在大样本测试数据上(80 MB),PARA-AC算法的平均加速比(计算不同模式串长度的加速比取平均)能达到原始匹配算法的13.91×。而在小文本(128 KB)上,采用多段匹配的PARA-AC算法的匹配速度低于原始的AC匹配算法,主要是因为:在PARA-AC算法处理小文本的过程中,线程的调度以及连接部分处理耗时带来的性能下降量远大于因并行匹配而带来的性能增加量,导致其匹配性能反而不如原始AC自动机。虽然在图4中,线程数为8时,并行性能高于串行性能,但当文本进一步变小时,该极值点会进一步左移直到整个曲线为单调递增。