《表1 LDA主题模型符号解释》

《表1 LDA主题模型符号解释》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于主题模型和关联规则的专利文本数据挖掘研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

LDA(Latent Dirichlet Allocation)是一种无监督的,可抽取文本特征的概率增长模型.LDA不需要事先对模型进行训练,可以通过无监督的学习方法来挖掘出文本中隐含的语义信息,将其应用到专利文本中时,不需要手动对文档添加标签,只需要给出期望生成的主题数K和主题中的TopN关键词N即可[14].LDA是一种“主题-文档-词汇”的三层贝叶斯模型,把主题视为词汇出现的概率分布,而文档认为是主题出现的概率分布,而构成主题的每一个词汇又都是无序的,那么就降低了文档的维度,大大简化了问题的复杂度[15].LDA主题模型如图3所示,模型的符号解释如表1所示.