《表5 不同覆盖率下生成的爬行检索词集合》
将爬行覆盖率设置成4个阈值(0.6、0.7、0.8、0.9),利用循环迭代算法进行爬行关键词的选取,分别得到对应于不用阈值的关键词序列,如表5所示。从结果中可以看出:随着覆盖率要求的提高,纳入爬行的检索词数量越多;有效命中率较高的检索词,由于可能与前序检索词存在较大的重复覆盖率(甚至其检索结果为前序检索词的子集),所以不一定会被纳入到爬行检索词序列,如天地图网站中的“培训”在覆盖率不大于0.9的要求下均不被纳入。
图表编号 | XD0052910600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.20 |
作者 | 周国新、吴永静、崔腾腾、杨辉山、罗安 |
绘制单位 | 广东省国土资源技术中心、广东省国土资源技术中心、中国测绘科学研究院、广东省国土资源技术中心、中国测绘科学研究院 |
更多格式 | 高清、无水印(增值服务) |