《表3 实验的部分PDF文档》

《表3 实验的部分PDF文档》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种面向PDF文本内容审查的高效多模式匹配算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文使用的实验硬件环境是:Intel C612 E5-2600v4 [email protected] GHz 16核;内存32 GB;操作系统为Cent OS 6.6;内核版本是3.10.0-123.e17.x86_64。程序代码使用C++语言编写,g++5.4.0编译,单线程运行。本文实验中选取的PDF文档包括100个100 KB~100 MB的PDF文件。由于篇幅的限制,表3列出了部分实验样本。随后使用PDFBinder 1.2软件将100个PDF文档进行合并,构成大小约500 MB的PDF文件,最后提取其中的stream文本内容用于算法性能测试。为了充分评估算法性能,实验根据PDF文本内容随机生成了数目分别为10 000、20 000、30 000、40 000、50 000、60 000、70 000、80 000共8个模式集合,其中最短模式串为12,最长模式串为168。