《表1 HDP模型中的符号说明》

《表1 HDP模型中的符号说明》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于主题和多重信任关系的微博推荐方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

主题挖掘模块的主要功能是利用HDP (Hierarchical Dirichlet Processes,分层狄利克雷过程)主题模型进行目标用户U及其关注用户V的微博主题挖掘,得到目标用户U及其关注用户V的主题概率分布,实现目标用户U及其关注用户V的个体兴趣偏好表达。由于利用LDA主题模型进行微博主题挖掘时,需要预先设置生成主题的K值,随机性和主观性较大,影响了最终生成主题的质量;同时,利用Dirichlet分布进行LDA主题采样,前提是各生成主题间是相互独立的,使得主题间的相关性得不到有效表达。HDP主题模型是一种在DP (Dirichlet Processes,狄利克雷过程)的基础上,使用Stick-breaking、Polya Ura或Chinese Restaurant Process构造狄利克雷过程的主题生成模型,主要特点是可以通过自动学习主题数目,挖掘文档内部深层次的语义信息,得到文档—主题—特征三层模型,无需预先设置生成主题K值,提高了最后生成主题的质量;同时,通过趋于无限的概率计算进行主题混合,能够根据不同的混合比例进行新的DP生成和新生主题共享,使得主题间的相关性得到表达[12]。因此,选择HDP主题模型进行微博用户主题挖掘,图2给出了利用HDP主题模型生成用户主题分布向量的图模型,表1对HDP图模型中的符号进行了说明。利用HDP主题模型进行微博主题挖掘的实现过程,主要分为4步: