《表5 不同覆盖率下生成的爬行检索词集合》

《表5 不同覆盖率下生成的爬行检索词集合》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《检索词优化与空间自适应的深网POI获取方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

将爬行覆盖率设置成4个阈值(0.6、0.7、0.8、0.9),利用循环迭代算法进行爬行关键词的选取,分别得到对应于不用阈值的关键词序列,如表5所示。从结果中可以看出:随着覆盖率要求的提高,纳入爬行的检索词数量越多;有效命中率较高的检索词,由于可能与前序检索词存在较大的重复覆盖率(甚至其检索结果为前序检索词的子集),所以不一定会被纳入到爬行检索词序列,如天地图网站中的“培训”在覆盖率不大于0.9的要求下均不被纳入。