《表1 不同主题的前1 000和2 000的查准率》
本文实验分为三个部分。第一部分实验是比较本文的基于改进BM25和SVM的聚焦爬虫在不同用户的不同主题上的查准率比较。首先,实验确定选取4个用户主题,它们分别为:计算机、体育、社会和财经。然后,分别根据不同的主题使用本文的聚焦爬虫在国内主流门户网站上获取前1 000个网页信息和前2 000个网页信息。最后,计算前1 000个网页信息的查准率和前2 000个网页信息的查准率。表1是计算机、体育、社会和财经的前1 000个和前2 000个网页信息的查准率的。
图表编号 | XD00129806400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 李莉、刘淼、冯嘉辉 |
绘制单位 | 长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院 |
更多格式 | 高清、无水印(增值服务) |