《表1 BFC与FC在录取分数爬取任务中表现对比》
本文选取传统聚焦爬虫(FC)作为基线算法进行对比。出于公平性考虑,FC所需分类器基于样例网页库的少量正样本,采用KNN算法获得。本文提出的自举聚焦爬虫(BFC)与基线算法FC在高校历史录取分数爬取任务中的表现对比如表1所示。
图表编号 | XD00153538200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.15 |
作者 | 徐昊、沈江明 |
绘制单位 | 中国电信股份有限公司云南分公司企业信息化部 |
更多格式 | 高清、无水印(增值服务) |
本文选取传统聚焦爬虫(FC)作为基线算法进行对比。出于公平性考虑,FC所需分类器基于样例网页库的少量正样本,采用KNN算法获得。本文提出的自举聚焦爬虫(BFC)与基线算法FC在高校历史录取分数爬取任务中的表现对比如表1所示。
图表编号 | XD00153538200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.15 |
作者 | 徐昊、沈江明 |
绘制单位 | 中国电信股份有限公司云南分公司企业信息化部 |
更多格式 | 高清、无水印(增值服务) |