《表3 实验的部分PDF文档》
本文使用的实验硬件环境是:Intel C612 E5-2600v4 [email protected] GHz 16核;内存32 GB;操作系统为Cent OS 6.6;内核版本是3.10.0-123.e17.x86_64。程序代码使用C++语言编写,g++5.4.0编译,单线程运行。本文实验中选取的PDF文档包括100个100 KB~100 MB的PDF文件。由于篇幅的限制,表3列出了部分实验样本。随后使用PDFBinder 1.2软件将100个PDF文档进行合并,构成大小约500 MB的PDF文件,最后提取其中的stream文本内容用于算法性能测试。为了充分评估算法性能,实验根据PDF文本内容随机生成了数目分别为10 000、20 000、30 000、40 000、50 000、60 000、70 000、80 000共8个模式集合,其中最短模式串为12,最长模式串为168。
图表编号 | XD00163346100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 刘邦国、陈庆春、类先富 |
绘制单位 | 西南交通大学信息科学与技术学院、西南交通大学信息科学与技术学院、西南交通大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |