《表4 针对用户查询的方法总结》

《表4 针对用户查询的方法总结》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于社交媒体的话题演变研究综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

针对用户查询的研究方法在建模事件演变之前,首先需要根据用户输入的查询词提取与事件相关的文本,这样的事件演变建模方式不仅支持历史事件的演变过程分析,也支持正处于演变状态中的新事件的演变过程。利用用户给定的关键词有时不能检索到与事件相关的子事件,从而使得事件的演变过程不完整,这时就需要利用查询扩展技巧对查询词进行扩展,以提高召回率。Lin等使用动态伪相关反馈的方式对查询词进行扩展,即认为每个相关文本在排序前的先验概率不是相同的,而是依赖于其发生时间与事件爆发时期的质心之间的距离[67]。Endo等也使用了伪相关反馈的方法,但在实际应用中,利用局部的图聚类算法获取包含查询词的子图,而不是在全局范围内对文本进行排序[68]。Zhao等利用复杂信息网络上的社交关系来扩展查询词,这里的社交关系包括词汇之间的共现关系、推文之间的回复关系、推文之间的作者关系以及用户之间的朋友关系,社交关系的引入使得该查询扩展的方法更适应社交媒体上的信息传播规律[69]。Tonon等提出一种新的使用语义搜索的方法,在推文中提取结构化数据并与DBpedia和WordNet这两个外部知识库整合构造出支持SPARQL查询的知识图谱[70]。另外,Bhardwaj等将他们的方法与普通的种子查询方法,以及基于词嵌入和基于时间上的词共现这两种扩展技巧进行比较分析,实验结果表明这几种方法在不同的事件上有着不同的效果,语义搜索的方法更适用于复杂具体的事件并在总体上优于其他方法[71]。以上方法都依靠查询扩展的方式丰富查询词的内容和范围,然后再用这些扩展之后的词去检索相关文本,如果扩展技巧采用不当,就会引入噪音数据,降低检索准确率。Brigadir等没有对查询词进行扩展,在检索与事件相关的推文时,提出基于BM25、基于神经网络语言模型以及基于随机索引三种方式计算查询词与文本之间的相似度,从而决定是否检索该文本,对文本中使用的所有词汇通过生成向量表示的方式将词汇和用户提及以及标签进行比较,省去了实体预处理以及查询扩展的需要[72]。表4对这些针对用户查询的方法进行总结。