《表3 不同算法的性能对比》
将Simhash算法与本文算法进行比较。本实验使用500个文本作为数据集,其中包含25个完全重复内容的文本,以及25个内容相似的文本。本文算法选择3作为匹配数,两种算法的精确率和召回率如表3所示。
图表编号 | XD00100237800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.15 |
作者 | 杨菊英、江兵、罗佳 |
绘制单位 | 电子科技大学成都学院计算机系、四川农业大学商学院、电子科技大学成都学院计算机系 |
更多格式 | 高清、无水印(增值服务) |
将Simhash算法与本文算法进行比较。本实验使用500个文本作为数据集,其中包含25个完全重复内容的文本,以及25个内容相似的文本。本文算法选择3作为匹配数,两种算法的精确率和召回率如表3所示。
图表编号 | XD00100237800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.15 |
作者 | 杨菊英、江兵、罗佳 |
绘制单位 | 电子科技大学成都学院计算机系、四川农业大学商学院、电子科技大学成都学院计算机系 |
更多格式 | 高清、无水印(增值服务) |