《表2 实验结果:基于语义相似聚合的主题爬虫算法研究》
本文将统计在相关度不同的情况下,PageRank算法、基于内容的PageRank算法和基于语义相似聚合的PageRan算法的对比结果。其中基于语义相似聚合的PageRan算法,以同义词词林[8]为基础计算上述关键词的相似词及相似度。同时,我们从已经抓取到的网页中随机抽取200个,然后人工统计与“中国传统文化”相关的网页的个数。实验结果如表2所示。
图表编号 | XD002524800 严禁用于非法目的 |
---|---|
绘制时间 | 2018.02.25 |
作者 | 吴林、王永滨 |
绘制单位 | 中国传媒大学计算机与网络中心、中国传媒大学科技处 |
更多格式 | 高清、无水印(增值服务) |